Google I/O-তে টিউন করার জন্য ধন্যবাদ। চাহিদা অনুযায়ী সব সেশন দেখুন চাহিদা অনুযায়ী দেখুন

BoostedTreesCalculateBestFeatureSplit

পাবলিক চূড়ান্ত বর্গ BoostedTreesCalculateBestFeatureSplit

প্রতিটি বৈশিষ্ট্যের জন্য লাভ গণনা করে এবং বৈশিষ্ট্যটির জন্য সম্ভাব্য সর্বোত্তম বিভক্ত তথ্য প্রদান করে।

বিভক্ত তথ্য হল সেরা থ্রেশহোল্ড (বালতি আইডি), লাভ এবং প্রতিটি বৈশিষ্ট্যের জন্য নোড প্রতি বাম/ডান নোড অবদান।

এটা সম্ভব যে সমস্ত নোড প্রতিটি বৈশিষ্ট্যে বিভক্ত করা যাবে না। সুতরাং, সম্ভাব্য নোডগুলির তালিকা বৈশিষ্ট্যগুলির মধ্যে পৃথক হতে পারে। অতএব, আমরা প্রতিটি বৈশিষ্ট্যের জন্য `node_ids_list` ফেরত দিই, যেখানে এই বৈশিষ্ট্যটি বিভক্ত করতে ব্যবহার করা যেতে পারে এমন নোডের তালিকা রয়েছে।

এই পদ্ধতিতে, আউটপুট হল প্রতি বৈশিষ্ট্য এবং প্রতি নোডের জন্য সর্বোত্তম বিভাজন, যাতে প্রতিটি নোডের জন্য (সমস্ত সম্ভাব্য বৈশিষ্ট্যগুলির মধ্যে) সর্বোত্তম বিভাজন তৈরি করতে এটিকে পরবর্তীতে একত্রিত করতে হবে।

আউটপুট আকারগুলি এমনভাবে সামঞ্জস্যপূর্ণ যে সমস্ত টেনসরের প্রথম মাত্রা একই এবং প্রতিটি বৈশিষ্ট্যের জন্য সম্ভাব্য বিভক্ত নোডের সংখ্যার সমান।

নেস্টেড ক্লাস

ক্লাস BoostedTreesCalculateBestFeatureSplit.Options জন্য ঐচ্ছিক বৈশিষ্ট্য BoostedTreesCalculateBestFeatureSplit

পাবলিক পদ্ধতি

স্ট্যাটিক BoostedTreesCalculateBestFeatureSplit
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <integer> nodeIdRange, প্রতীক <ফ্লোট> statsSummary, প্রতীক <ফ্লোট> L1, প্রতীক <ফ্লোট> L2, প্রতীক <ফ্লোট> treeComplexity, প্রতীক <ফ্লোট> minNodeWeight, লং logitsDimension, বিকল্পসমূহ ... অপশন)
একটি নতুন BoostedTreesCalculateBestFeatureSplit অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
আউটপুট <integer>
featureDimensions ()
একটি র্যাঙ্ক 1 টেনসর প্রতিটি বৈশিষ্ট্যের জন্য সর্বোত্তম বৈশিষ্ট্যের মাত্রা নির্দেশ করে যদি বৈশিষ্ট্যটি বহু-মাত্রা হয় তবে নির্দিষ্ট নোডগুলির জন্য বিভক্ত হওয়ার জন্য।
আউটপুট <ফ্লোট>
লাভ ()
একটি র্যাঙ্ক 1 টেনসর নির্দিষ্ট নোডের জন্য বিভক্ত করার জন্য প্রতিটি বৈশিষ্ট্যের জন্য সেরা লাভ নির্দেশ করে।
আউটপুট <ফ্লোট>
leftNodeContribs ()
প্রতিটি বৈশিষ্ট্যের জন্য প্রদত্ত থ্রেশহোল্ড দ্বারা বাম দিকের প্যারেন্ট নোড (আউটপুট নোড_আইডি_লিস্টে টেনসর উপাদান দ্বারা প্রদত্ত) থেকে শাখা করা হলে বাম নোডগুলির অবদান নির্দেশ করে একটি র্যাঙ্ক 2 টেনসর৷
আউটপুট <integer>
nodeIds ()
একটি র্যাঙ্ক 1 টেনসর প্রতিটি বৈশিষ্ট্যের জন্য সম্ভাব্য বিভক্ত নোড আইডি নির্দেশ করে।
আউটপুট <ফ্লোট>
rightNodeContribs ()
একটি র‍্যাঙ্ক 2 টেনসর, লেফট_নোড_কন্ট্রিবস_লিস্টের মতো একই আকৃতি/পরিস্থিতি সহ, কিন্তু মানটি ডান নোডের জন্য।
স্ট্যাটিক BoostedTreesCalculateBestFeatureSplit.Options
splitType (স্ট্রিং splitType)
আউটপুট <স্ট্রিং>
splitWithDefaultDirections ()
একটি র্যাঙ্ক 1 টেনসর তথ্য অনুপস্থিত থাকলে কোন দিকে যেতে হবে তা নির্দেশ করে।
আউটপুট <integer>
প্রান্তিক মান ()
একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডে বিভক্ত হওয়ার জন্য (একটি প্রান্তিক হিসাবে) তুলনা করার জন্য বালতি আইডি নির্দেশ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক BoostedTreesCalculateBestFeatureSplit (তৈরি ব্যাপ্তি সুযোগ প্রতীক <integer> nodeIdRange, প্রতীক <ফ্লোট> statsSummary, প্রতীক <ফ্লোট> L1, প্রতীক <ফ্লোট> L2, প্রতীক <ফ্লোট> treeComplexity, প্রতীক <ফ্লোট> minNodeWeight, লং logitsDimension, বিকল্প .. । অপশন)

একটি নতুন BoostedTreesCalculateBestFeatureSplit অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
nodeIdRange একটি র‍্যাঙ্ক 1 টেনসর (আকৃতি=[2]) নোড আইডিগুলির পরিসর [প্রথম, শেষ) নির্দিষ্ট করতে `stats_summary_list`-এর মধ্যে প্রক্রিয়া করতে। নোডগুলি টেনসর দ্বারা নির্দিষ্ট করা দুটি নোডের মধ্যে পুনরাবৃত্তি করা হয়, যেমন `পরিসরে নোড_আইডির জন্য(নোড_আইডি_রেঞ্জ[0], নোড_আইডি_রেঞ্জ[1])` (উল্লেখ্য যে শেষ সূচক নোড_আইডি_রেঞ্জ[1] একচেটিয়া)।
পরিসংখ্যান সংক্ষিপ্তসার একটি র্যাঙ্ক 4 টেনসর (#shape=[max_splits, feature_dims, bucket, stats_dims]) প্রতিটি বৈশিষ্ট্যের জন্য প্রতি নোড, প্রতি মাত্রা, প্রতি বালতিতে জমা হওয়া পরিসংখ্যান সারাংশের (গ্রেডিয়েন্ট/হেসিয়ান) জন্য। টেনসরের প্রথম মাত্রা হল সর্বোচ্চ সংখ্যক বিভাজন, এবং এইভাবে এর সমস্ত উপাদান ব্যবহার করা হবে না, তবে শুধুমাত্র node_ids দ্বারা নির্দিষ্ট করা সূচী ব্যবহার করা হবে।
l1 l1 পাতার ওজনের উপর নিয়মিতকরণ ফ্যাক্টর, প্রতি উদাহরণ ভিত্তিক।
l2 l2 পাতার ওজনের উপর নিয়মিতকরণ ফ্যাক্টর, প্রতি উদাহরণ ভিত্তিক।
গাছের জটিলতা লাভের সামঞ্জস্য, প্রতি পাতা ভিত্তিক।
minNodeWeight নোডকে বিভক্ত করার জন্য বিবেচনা করার আগে একটি নোডে হেসিয়ানের ন্যূনতম গড়।
logits মাত্রা লগিটের মাত্রা, অর্থাৎ ক্লাসের সংখ্যা।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • BoostedTreesCalculateBestFeatureSplit এর একটি নতুন উদাহরণ

পাবলিক আউটপুট <integer> featureDimensions ()

একটি র্যাঙ্ক 1 টেনসর প্রতিটি বৈশিষ্ট্যের জন্য সর্বোত্তম বৈশিষ্ট্যের মাত্রা নির্দেশ করে যদি বৈশিষ্ট্যটি বহু-মাত্রা হয় তবে নির্দিষ্ট নোডগুলির জন্য বিভক্ত হওয়ার জন্য। আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন।

পাবলিক আউটপুট <ফ্লোট> লাভ ()

একটি র্যাঙ্ক 1 টেনসর নির্দিষ্ট নোডের জন্য বিভক্ত করার জন্য প্রতিটি বৈশিষ্ট্যের জন্য সেরা লাভ নির্দেশ করে। আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন।

পাবলিক আউটপুট <ফ্লোট> leftNodeContribs ()

প্রতিটি বৈশিষ্ট্যের জন্য প্রদত্ত থ্রেশহোল্ড দ্বারা বাম দিকের প্যারেন্ট নোড (আউটপুট নোড_আইডি_লিস্টে টেনসর উপাদান দ্বারা প্রদত্ত) থেকে শাখা করা হলে বাম নোডগুলির অবদান নির্দেশ করে একটি র্যাঙ্ক 2 টেনসর৷ এই মানটি প্যারেন্ট নোডের মান যোগ করে বাম নোডের মান তৈরি করতে ব্যবহার করা হবে। দ্বিতীয় মাত্রার আকার 1-মাত্রিক লগিটগুলির জন্য 1, কিন্তু বহু-শ্রেণীর সমস্যার জন্য বড় হবে৷ আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন।

পাবলিক আউটপুট <integer> nodeIds ()

একটি র্যাঙ্ক 1 টেনসর প্রতিটি বৈশিষ্ট্যের জন্য সম্ভাব্য বিভক্ত নোড আইডি নির্দেশ করে। তালিকার দৈর্ঘ্য হল num_features, কিন্তু প্রতিটি টেনসরের আকার আলাদা কারণ প্রতিটি বৈশিষ্ট্য বিভিন্ন সম্ভাব্য নোড প্রদান করে। আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন।

পাবলিক আউটপুট <ফ্লোট> rightNodeContribs ()

একটি র‍্যাঙ্ক 2 টেনসর, লেফট_নোড_কন্ট্রিবস_লিস্টের মতো একই আকৃতি/পরিস্থিতি সহ, কিন্তু মানটি ডান নোডের জন্য।

পাবলিক স্ট্যাটিক BoostedTreesCalculateBestFeatureSplit.Options splitType (স্ট্রিং splitType)

পরামিতি
splitType এই অপের অসমতা বিভাজন বা সমতা বিভক্ত করা উচিত কিনা তা নির্দেশ করে একটি স্ট্রিং।

পাবলিক আউটপুট <স্ট্রিং> splitWithDefaultDirections ()

একটি র্যাঙ্ক 1 টেনসর তথ্য অনুপস্থিত থাকলে কোন দিকে যেতে হবে তা নির্দেশ করে। আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন। ডিফল্ট বাম রিটার্ন 0 এর সাথে অসমতা, ডিফল্ট ডান রিটার্ন 1 এর সাথে অসমতা, ডিফল্ট ডান রিটার্ন 2 এর সাথে সমতা।

পাবলিক আউটপুট <integer> প্রান্তিক মান ()

একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডে বিভক্ত হওয়ার জন্য (একটি প্রান্তিক হিসাবে) তুলনা করার জন্য বালতি আইডি নির্দেশ করে। আকার এবং আকারের মতো বিশদ বিবরণের জন্য উপরে দেখুন।