BoostedTreesSparseCalculateBestFeatureSplit

الطبقة النهائية العامة BoostedTreesSparseCalculateBestFeatureSplit

حساب المكاسب لكل ميزة وإرجاع أفضل معلومات تقسيم ممكنة للميزة.

المعلومات المقسمة هي أفضل عتبة (معرف المجموعة) والمكاسب ومساهمات العقدة اليسرى/اليمنى لكل عقدة لكل ميزة.

من الممكن أنه لا يمكن تقسيم جميع العقد على كل ميزة. وبالتالي، يمكن أن تختلف قائمة العقد المحتملة بين الميزات. لذلك، نعيد "node_ids_list" لكل ميزة، والتي تحتوي على قائمة العقد التي يمكن استخدام هذه الميزة لتقسيمها.

بهذه الطريقة، يكون الإخراج هو أفضل تقسيم لكل ميزة ولكل عقدة، بحيث يجب دمجها لاحقًا لإنتاج أفضل تقسيم لكل عقدة (من بين جميع الميزات الممكنة).

تتوافق أشكال المخرجات بطريقة تجعل البعد الأول لجميع الموترات متماثلًا ويساوي عدد العقد المنقسمة المحتملة لكل ميزة.

فئات متداخلة

فصل BoostedTreesSparseCalculateBestFeatureSplit.Options السمات الاختيارية لـ BoostedTreesSparseCalculateBestFeatureSplit

الأساليب العامة

static BoostedTreesSparseCalculateBestFeatureSplit
إنشاء (نطاق النطاق ، المعامل <Integer> عقدة IdRange، المعامل <Integer> statsSummaryIndices، المعامل <Float> statsSummaryValues، المعامل <Integer> statsSummaryShape، المعامل <Float> l1، المعامل <Float> l2، المعامل <Float> تعقيد الشجرة، المعامل <Float > minNodeWeight، أبعاد السجل الطويلة، الخيارات... الخيارات)
طريقة المصنع لإنشاء فئة تلتف حول عملية BoostedTreesSparseCalculateBestFeatureSplit جديدة.
الإخراج <عدد صحيح>
أبعاد الميزة ()
موتر من المرتبة الأولى يشير إلى أفضل بُعد للميزة لكل ميزة لتقسيمها لكل عقدة.
الإخراج <تعويم>
المكاسب ()
موتر من المرتبة الأولى يشير إلى أفضل المكاسب لتقسيم كل عقدة.
الإخراج <تعويم>
leftNodeContribs ()
موتر من المرتبة الثانية يشير إلى مساهمة العقد اليسرى عند التفرع من العقد الأصلية إلى الاتجاه الأيسر بواسطة العتبة المحددة لكل ميزة.
الإخراج <عدد صحيح>
معرفات العقدة ()
موتر من المرتبة الأولى يشير إلى معرفات العقدة المحتملة التي يمكن تقسيمها.
الإخراج <تعويم>
RightNodeContribs ()
موتر من المرتبة الثانية، بنفس الشكل/الشروط مثل left_node_contribs_list، ولكن القيمة فقط للعقدة اليمنى.
ثابت BoostedTreesSparseCalculateBestFeatureSplit.Options
نوع الانقسام (نوع سلسلة الانقسام)
الإخراج <سلسلة>
سبليت ويذديفولتديركشنز ()
يشير الموتر من المرتبة الأولى إلى الاتجاه الذي يجب اتباعه في حالة فقدان البيانات.
الإخراج <عدد صحيح>
الحدود القصوى ()
موتر من المرتبة الأولى يشير إلى معرف المجموعة المراد مقارنته (كعتبة) للتقسيم في كل عقدة.

الطرق الموروثة

الأساليب العامة

BOOSTEDTREESSERSECALITYBESTFUETURESPLIT (نطاق النطاق ، المعامل <integer> nodeidrange ، المعامل <integer> statssummaryIndices ، staring <loat> statssummaryvalues ​​، kears <integer> statsummaryshape ، operand <l1 ، operand <loyt> <ploat> المعامل <Float> minNodeWeight، Long logitsDimension، Options... options)

طريقة المصنع لإنشاء فئة تلتف حول عملية BoostedTreesSparseCalculateBestFeatureSplit جديدة.

حدود
نِطَاق النطاق الحالي
NodeIdRange موتر من المرتبة الأولى (الشكل=[2]) لتحديد النطاق [الأول والأخير) لمعرفات العقدة المراد معالجتها ضمن "stats_summary_list". يتم تكرار العقد بين العقدتين المحددتين بواسطة الموتر، كما هو الحال `fornode_id in range(node_id_range[0],node_id_range[1])` (لاحظ أن الفهرس الأخيرNode_id_range[1] حصري).
statsSummaryIndices موتر int64 من الرتبة 2 ذو شكل كثيف [N, 4] (يحدد N عدد القيم غير الصفرية) لملخص الإحصائيات المتراكمة (التدرج/الهيسي) لكل عقدة لكل مجموعة لكل ميزة. يحتوي البعد الثاني على معرف العقدة وبُعد الميزة ومعرف المجموعة والإحصائيات المعتمة. الإحصائيات الخافتة هي مجموع البعد اللوجيستي والبعد الهسي، يمكن أن يكون البعد الهيسي إما بُعدًا لوجيستيًا إذا تم استخدام الهسي القطري، أو البعد اللوجيستي ^ 2 إذا تم استخدام الهسي الكامل.
statsSummaryValues موتر عائم من المرتبة الأولى ذو شكل كثيف [N] (يحدد N عدد القيم غير الصفرية)، والذي يوفر القيم لكل عنصر في Summary_indices.
statsSummaryShape موتر عائم من المرتبة الأولى ذو شكل كثيف [4]، والذي يحدد الشكل الكثيف للموتر المتناثر، وهو [عقد شجرة الأعداد، أبعاد الميزة، عدد الأعداد، الإحصائيات المعتمة].
l1 عامل التنظيم l1 على أوزان الأوراق، على أساس كل مثيل.
l2 عامل التنظيم l2 على أوزان الأوراق، على أساس كل مثيل.
TreeComplexity تعديل الكسب، على أساس كل ورقة.
minNodeWeight الحد الأدنى لمتوسط ​​عدد الهسه في العقدة قبل أن يكون مطلوبًا حتى يتم أخذ العقدة بعين الاعتبار للتقسيم.
logitsDimension البعد اللوغاريتمي، أي عدد الفئات.
خيارات يحمل قيم السمات الاختيارية
عائدات
  • مثيل جديد لـ BoostedTreesSparseCalculateBestFeatureSplit

الإخراج العام <عدد صحيح> featureDimensions ()

موتر من المرتبة الأولى يشير إلى أفضل بُعد للميزة لكل ميزة لتقسيمها لكل عقدة.

مكاسب الإخراج العام <Float> ()

موتر من المرتبة الأولى يشير إلى أفضل المكاسب لتقسيم كل عقدة.

الإخراج العام <Float> leftNodeContribs ()

موتر من المرتبة الثانية يشير إلى مساهمة العقد اليسرى عند التفرع من العقد الأصلية إلى الاتجاه الأيسر بواسطة العتبة المحددة لكل ميزة. سيتم استخدام هذه القيمة لإنشاء قيمة العقدة اليسرى عن طريق إضافتها إلى قيمة العقدة الأصلية. حجم البعد الثاني هو البعد اللوجيستي.

معرفات الإخراج العامة < عدد صحيح > ()

موتر من المرتبة الأولى يشير إلى معرفات العقدة المحتملة التي يمكن تقسيمها.

الإخراج العام <Float> rightNodeContribs ()

موتر من المرتبة الثانية، بنفس الشكل/الشروط مثل left_node_contribs_list، ولكن القيمة فقط للعقدة اليمنى.

ثابت عام BoostedTreesSparseCalculateBestFeatureSplit.Options SplitType (سلسلة SplitType)

حدود
نوع منقسم سلسلة تشير إلى ما إذا كان يجب على هذه العملية تنفيذ تقسيم عدم المساواة أو تقسيم المساواة.

الإخراج العام <String> SplitWithDefaultDirections ()

يشير الموتر من المرتبة الأولى إلى الاتجاه الذي يجب اتباعه في حالة فقدان البيانات. عدم المساواة مع عائدات اليسار الافتراضية 0، عدم المساواة مع عائدات اليمين الافتراضية 1، المساواة مع عائدات اليمين الافتراضية 2.

عتبات الإخراج العام <عدد صحيح> ()

موتر من المرتبة الأولى يشير إلى معرف المجموعة المراد مقارنته (كعتبة) للتقسيم في كل عقدة.