BoostedTreesSparseCalculateBestFeatureSplit

পাবলিক ফাইনাল ক্লাস বুস্টেড ট্রিসস্পার্স ক্যালকুলেট বেস্ট ফিচার স্প্লিট

প্রতিটি বৈশিষ্ট্যের জন্য লাভ গণনা করে এবং বৈশিষ্ট্যটির জন্য সম্ভাব্য সর্বোত্তম বিভক্ত তথ্য প্রদান করে।

বিভক্ত তথ্য হল সেরা থ্রেশহোল্ড (বালতি আইডি), লাভ এবং প্রতিটি বৈশিষ্ট্যের জন্য নোড প্রতি বাম/ডান নোড অবদান।

এটা সম্ভব যে সমস্ত নোড প্রতিটি বৈশিষ্ট্যে বিভক্ত করা যাবে না। সুতরাং, সম্ভাব্য নোডগুলির তালিকা বৈশিষ্ট্যগুলির মধ্যে পৃথক হতে পারে। অতএব, আমরা প্রতিটি বৈশিষ্ট্যের জন্য `node_ids_list` ফেরত দিই, যেখানে এই বৈশিষ্ট্যটি বিভক্ত করতে ব্যবহার করা যেতে পারে এমন নোডের তালিকা রয়েছে।

এই পদ্ধতিতে, আউটপুট হল প্রতি বৈশিষ্ট্য এবং প্রতি নোডের জন্য সর্বোত্তম বিভাজন, যাতে প্রতিটি নোডের জন্য (সকল সম্ভাব্য বৈশিষ্ট্যগুলির মধ্যে) সর্বোত্তম বিভাজন তৈরি করার জন্য এটি পরবর্তীতে একত্রিত করা প্রয়োজন।

আউটপুট আকারগুলি এমনভাবে সামঞ্জস্যপূর্ণ যে সমস্ত টেনসরের প্রথম মাত্রা একই এবং প্রতিটি বৈশিষ্ট্যের জন্য সম্ভাব্য বিভক্ত নোডের সংখ্যার সমান।

নেস্টেড ক্লাস

ক্লাস BoostedTreesSparseCalculateBestFeatureSplit.Options BoostedTreesSparseCalculateBestFeatureSplit এর জন্য ঐচ্ছিক বৈশিষ্ট্য

পাবলিক পদ্ধতি

স্ট্যাটিক বুস্টেড ট্রিসস্পার্স ক্যালকুলেট বেস্ট ফিচার স্প্লিট
তৈরি করুন ( স্কোপ স্কোপ, Operand <Integer> nodeIdRange, Operand <Integer> statsSummaryIndices, Operand <Float> statsSummaryValues, Operand <Integer> statsSummaryShape, Operand <Float> l1, Operand <Float> l1, Operand <loperand> Operand> Operand > এবং <ভাসা > minNodeweight, লং লজিটস ডাইমেনশন, অপশন... অপশন)
একটি নতুন BoostedTreesSparseCalculateBestFeatureSplit অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
আউটপুট <পূর্ণসংখ্যা>
বৈশিষ্ট্য মাত্রা ()
একটি র‍্যাঙ্ক 1 টেনসর প্রতিটি নোডের জন্য বিভক্ত করার জন্য প্রতিটি বৈশিষ্ট্যের জন্য সেরা বৈশিষ্ট্যের মাত্রা নির্দেশ করে।
আউটপুট <ফ্লোট>
লাভ ()
একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডকে বিভক্ত করার জন্য সেরা লাভ নির্দেশ করে।
আউটপুট <ফ্লোট>
leftNodeContribs ()
প্রতিটি বৈশিষ্ট্যের জন্য প্রদত্ত থ্রেশহোল্ড দ্বারা প্যারেন্ট নোড থেকে বাম দিকে শাখা করার সময় একটি র্যাঙ্ক 2 টেনসর বাম নোডগুলির অবদানকে নির্দেশ করে৷
আউটপুট <পূর্ণসংখ্যা>
nodeIds ()
একটি র্যাঙ্ক 1 টেনসর সম্ভাব্য নোড আইডি নির্দেশ করে যা বিভক্ত করা যেতে পারে।
আউটপুট <ফ্লোট>
rightNodeContribs ()
একটি র‍্যাঙ্ক 2 টেনসর, লেফট_নোড_কন্ট্রিবস_লিস্টের মতো একই আকৃতি/পরিস্থিতি সহ, কিন্তু ঠিক যে মানটি ডান নোডের জন্য।
স্ট্যাটিক বুস্টেড ট্রিসস্পার্স ক্যালকুলেট বেস্ট ফিচার স্প্লিট। অপশন
স্প্লিট টাইপ (স্ট্রিং স্প্লিট টাইপ)
আউটপুট <স্ট্রিং>
splitWithDefaultDirections ()
একটি র্যাঙ্ক 1 টেনসর নির্দেশ করে যে ডেটা অনুপস্থিত থাকলে কোন দিকে যেতে হবে।
আউটপুট <পূর্ণসংখ্যা>
প্রান্তিক ()
একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডে বিভক্ত হওয়ার জন্য (একটি থ্রেশহোল্ড হিসাবে) তুলনা করার জন্য বালতি আইডি নির্দেশ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক বুস্টেড ট্রিসস্পার্স ক্যালকুলেট বেস্ট ফিচার স্প্লিট তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <পূর্ণসংখ্যা> নোডআইডিরেঞ্জ, অপারেন্ড <পূর্ণসংখ্যা> পরিসংখ্যানসামরি সূচক, অপারেন্ড <ফ্লোট> পরিসংখ্যানসামরি মান, অপারেন্ড <সম্পূর্ণতা>, Operand <Integer, Operand , Operand <Integer> <Float> l2, Operand <Float> গাছের জটিলতা, অপারেন্ড <ফ্লোট> মিননোডওয়েট, লং লজিটস ডাইমেনশন, অপশন... অপশন)

একটি নতুন BoostedTreesSparseCalculateBestFeatureSplit অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
nodeIdRange একটি র‍্যাঙ্ক 1 টেনসর (আকৃতি=[2]) নোড আইডিগুলির পরিসর [প্রথম, শেষ) নির্দিষ্ট করতে `stats_summary_list`-এর মধ্যে প্রক্রিয়াকরণ করতে। নোডগুলি টেনসর দ্বারা নির্দিষ্ট করা দুটি নোডের মধ্যে পুনরাবৃত্তি করা হয়, যেমন `পরিসরে নোড_আইডির জন্য(নোড_আইডি_রেঞ্জ[0], নোড_আইডি_রেঞ্জ[1])` (উল্লেখ্য যে শেষ সূচক নোড_আইডি_রেঞ্জ[1] একচেটিয়া)।
পরিসংখ্যান সংক্ষিপ্ত সূচক একটি র‍্যাঙ্ক 2 int64 ঘন আকৃতির টেনসর [N, 4] (N অ-শূন্য মানের সংখ্যা নির্দিষ্ট করে) প্রতিটি বৈশিষ্ট্যের জন্য প্রতি বালতি প্রতি নোডে জমা হওয়া পরিসংখ্যান সারাংশ (গ্রেডিয়েন্ট/হেসিয়ান)। দ্বিতীয় মাত্রা নোড আইডি, বৈশিষ্ট্য মাত্রা, বালতি আইডি, এবং পরিসংখ্যান আবছা রয়েছে। stats dim হল লগিট ডাইমেনশন এবং হেসিয়ান ডাইমেনশনের যোগফল, হেসিয়ান ডাইমেনশন হয় লগিট ডাইমেনশন হতে পারে যদি ডায়াগোনাল হেসিয়ান ব্যবহার করা হয়, অথবা পূর্ণ হেসিয়ান ব্যবহার করা হলে লগিট ডাইমেনশান^2।
পরিসংখ্যান সংক্ষিপ্ত মান ঘন আকৃতির একটি র্যাঙ্ক 1 ফ্লোট টেনসর [N] (N অ-শূন্য মানের সংখ্যা নির্দিষ্ট করে), যা সারাংশ_সূচকে প্রতিটি উপাদানের জন্য মান সরবরাহ করে।
statsSummaryShape ঘন আকৃতির একটি র্যাঙ্ক 1 ফ্লোট টেনসর [4], যা স্পারস টেনসরের ঘন আকৃতি নির্দিষ্ট করে, যা [সংখ্যা ট্রি নোড, বৈশিষ্ট্যের মাত্রা, সংখ্যা বালতি, পরিসংখ্যান ম্লান]।
l1 l1 পাতার ওজনের উপর নিয়মিতকরণ ফ্যাক্টর, প্রতি উদাহরণ ভিত্তিক।
l2 l2 পাতার ওজনের উপর নিয়মিতকরণ ফ্যাক্টর, প্রতি উদাহরণ ভিত্তিক।
গাছের জটিলতা লাভের সামঞ্জস্য, প্রতি পাতা ভিত্তিক।
minNodeWeight নোডকে বিভক্ত করার জন্য বিবেচনা করার আগে একটি নোডে হেসিয়ানের ন্যূনতম গড়।
logits মাত্রা লগিট এর মাত্রা, অর্থাৎ ক্লাসের সংখ্যা।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • BoostedTreesSparseCalculateBestFeatureSplit এর একটি নতুন উদাহরণ

সর্বজনীন আউটপুট <পূর্ণসংখ্যা> বৈশিষ্ট্য মাত্রা ()

একটি র‍্যাঙ্ক 1 টেনসর প্রতিটি নোডের জন্য বিভক্ত করার জন্য প্রতিটি বৈশিষ্ট্যের জন্য সেরা বৈশিষ্ট্যের মাত্রা নির্দেশ করে।

পাবলিক আউটপুট <ফ্লোট> লাভ ()

একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডকে বিভক্ত করার জন্য সেরা লাভ নির্দেশ করে।

সর্বজনীন আউটপুট <ফ্লোট> leftNodeContribs ()

প্রতিটি বৈশিষ্ট্যের জন্য প্রদত্ত থ্রেশহোল্ড দ্বারা প্যারেন্ট নোড থেকে বাম দিকে শাখা করার সময় একটি র্যাঙ্ক 2 টেনসর বাম নোডগুলির অবদানকে নির্দেশ করে৷ এই মানটি প্যারেন্ট নোডের মান যোগ করে বাম নোডের মান তৈরি করতে ব্যবহার করা হবে। দ্বিতীয় মাত্রার আকার হল লগিট মাত্রা।

সর্বজনীন আউটপুট <Integer> nodeIds ()

একটি র্যাঙ্ক 1 টেনসর সম্ভাব্য নোড আইডি নির্দেশ করে যা বিভক্ত করা যেতে পারে।

সর্বজনীন আউটপুট <ফ্লোট> rightNodeContribs ()

একটি র‍্যাঙ্ক 2 টেনসর, লেফট_নোড_কন্ট্রিবস_লিস্টের মতো একই আকৃতি/পরিস্থিতি সহ, কিন্তু ঠিক যে মানটি ডান নোডের জন্য।

পাবলিক স্ট্যাটিক বুস্টেড ট্রিসস্পার্স ক্যালকুলেট বেস্ট ফিচার স্প্লিট। অপশন স্প্লিট টাইপ (স্ট্রিং স্প্লিট টাইপ)

পরামিতি
splitType এই অপের অসমতা বিভাজন বা সমতা বিভক্ত করা উচিত কিনা তা নির্দেশ করে একটি স্ট্রিং।

সর্বজনীন আউটপুট <স্ট্রিং> splitWithDefaultDirections ()

একটি র্যাঙ্ক 1 টেনসর নির্দেশ করে যে ডেটা অনুপস্থিত থাকলে কোন দিকে যেতে হবে। ডিফল্ট বাম রিটার্ন 0 এর সাথে অসমতা, ডিফল্ট ডান রিটার্ন 1 এর সাথে অসমতা, ডিফল্ট ডান রিটার্ন 2 এর সাথে সমতা।

সর্বজনীন আউটপুট <পূর্ণসংখ্যা> থ্রেশহোল্ড ()

একটি র্যাঙ্ক 1 টেনসর প্রতিটি নোডে বিভক্ত হওয়ার জন্য (একটি থ্রেশহোল্ড হিসাবে) তুলনা করার জন্য বালতি আইডি নির্দেশ করে।