BoostedTreesCalculateBestFeatureSplitV2

כיתת גמר ציבורית BoostedTreesCalculateBestFeatureSplitV2

מחשב רווחים עבור כל תכונה ומחזיר את המידע המפוצל הטוב ביותר עבור כל צומת. עם זאת, אם לא נמצא פיצול, לא יוחזר מידע מפוצל עבור אותו צומת.

המידע המפוצל הוא הסף הטוב ביותר (מזהה דלי), רווחים ותרומת צומת שמאל/ימין לכל צומת עבור כל תכונה.

ייתכן שלא ניתן לפצל את כל הצמתים בכל תכונה. לפיכך, רשימת הצמתים האפשריים יכולה להיות שונה בין התכונות. לכן, אנו מחזירים `node_ids_list` עבור כל תכונה, המכילה את רשימת הצמתים שניתן להשתמש בתכונה זו לפיצול.

באופן זה, הפלט הוא הפיצול הטוב ביותר לכל תכונות ולכל צומת, כך שצריך לשלב אותו מאוחר יותר כדי לייצר את הפיצול הטוב ביותר עבור כל צומת (בין כל התכונות האפשריות).

צורות הפלט תואמות באופן שהמימד הראשון של כל הטנזורים זהה ושווה למספר הצמתים המפוצלים האפשריים עבור כל תכונה.

שיטות ציבוריות

סטטי BoostedTreesCalculateBestFeatureSplitV2
create ( Scope scope, Operand <Integer> nodeIdRange, Iterable< Operand <Float>> statsSummariesList, Operand <String> splitTypes, Operand <Integer> candidateFeatureIds, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity Operand <Float> minNodeWeight, Long logitsDimension)
שיטת מפעל ליצירת מחלקה העוטפת פעולת BoostedTreesCalculateBestFeatureSplitV2 חדשה.
פלט <מספר שלם>
featureDimensions ()
טנסור דירוג 1 המציין את ממד התכונה הטוב ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים אם התכונה היא רב-ממדית.
פלט <מספר שלם>
featureIds ()
טנסור דרגה 1 המציין את מזהה התכונה הטוב ביותר עבור כל צומת.
פלט <צף>
רווחים ()
טנזור דרגה 1 המציין את הרווחים הטובים ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים.
פלט <צף>
leftNodeContribs ()
טנסור דירוג 2 המציין את תרומתם של הצמתים השמאליים בעת הסתעפות מצמתי אב (ניתן על ידי אלמנט הטנזור ב-out node_ids_list) לכיוון שמאל לפי הסף הנתון עבור כל תכונה.
פלט <מספר שלם>
nodeIds ()
טנסור דרגה 1 המציין מזהי צומת מפוצלים אפשריים עבור כל תכונה.
פלט <צף>
rightNodeContribs ()
טנסור דרגה 2, עם אותם צורה/תנאים כמו left_node_contribs_list, אבל רק שהערך הוא עבור הצומת הימני.
פלט <מחרוזת>
splitWithDefaultDirections ()
טנסור דרגה 1 המציין לאיזה כיוון ללכת אם חסרים נתונים.
פלט <מספר שלם>
ספים ()
טנסור דרגה 1 המציין את מזהה הדלי שיש להשוות איתו (כסף) לפיצול בכל צומת.

שיטות בירושה

שיטות ציבוריות

public static BoostedTreesCalculateBestFeatureSplitV2 create ( scope scope, Operand <Integer> nodeIdRange, Iterable< Operand <Float>> statsSummariesList, Operand <String> splitTypes, Operand <Integer> candidateFeatureIds, <OperndFloat>, <OperndFloat> > treeComplexity, Operand <Float> minNodeWeight, Long logitsDimension)

שיטת מפעל ליצירת מחלקה העוטפת פעולת BoostedTreesCalculateBestFeatureSplitV2 חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
nodeIdRange טנסור דירוג 1 (צורה=[2]) כדי לציין את הטווח [ראשון, אחרון) של מזהי צומת לעיבוד בתוך `stats_summary_list`. הצמתים עוברים איטרציה בין שני הצמתים שצוינו על ידי הטנזור, כמו `for node_id in range(node_id_range[0], node_id_range[1])` (שים לב שהאינדקס האחרון node_id_range[1] הוא בלעדי).
סטטיסטיקותSummariesList רשימה של טנזור דירוג 4 (#shape=[max_splits, feature_dims, bucket, stats_dims]) עבור סיכום נתונים סטטיסטיים מצטברים (שיפוע/הסיאן) לכל צומת, לכל ממד, לכל דליים עבור כל תכונה. המימד הראשון של הטנזור הוא המספר המרבי של פיצולים, ולכן לא כל האלמנטים שלו ישמשו, אלא רק האינדקסים שצוינו על ידי node_ids ישמשו.
splitTypes טנסור דירוג 1 המציין אם ה-Op הזה צריך לבצע פיצול אי-שוויון או פיצול שוויון לכל תכונה.
candidateFeatureIds דרג טנסור 1 עם מזהים עבור כל תכונה. זהו המזהה האמיתי של התכונה.
l1 גורם רגוליזציה l1 על משקלי עלים, לפי מופע.
l2 גורם רגוליזציה l2 על משקלי עלים, לפי מופע.
מורכבות עץ התאמה לרווח, לפי עלה.
minNodeWeight הממוצע המינימלי של הסינים בצומת נדרש לפני שהצומת ייחשב לפיצול.
logitsDimension הממד של logit, כלומר, מספר המחלקות.
החזרות
  • מופע חדש של BoostedTreesCalculateBestFeatureSplitV2

פלט ציבורי <Integer> featureDimensions ()

טנסור דירוג 1 המציין את ממד התכונה הטוב ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים אם התכונה היא רב-ממדית. ראה למעלה לפרטים כמו צורות וגדלים.

פלט ציבורי <Integer> featureIds ()

טנסור דרגה 1 המציין את מזהה התכונה הטוב ביותר עבור כל צומת. ראה למעלה לפרטים כמו צורות וגדלים.

רווחי פלט ציבורי <Float> ()

טנזור דרגה 1 המציין את הרווחים הטובים ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים. ראה למעלה לפרטים כמו צורות וגדלים.

פלט ציבורי <Float> leftNodeContribs ()

טנסור דירוג 2 המציין את תרומתם של הצמתים השמאליים בעת הסתעפות מצמתי אב (ניתן על ידי אלמנט הטנזור ב-out node_ids_list) לכיוון שמאל לפי הסף הנתון עבור כל תכונה. ערך זה ישמש ליצירת ערך הצומת השמאלי על ידי הוספה לערך הצומת האב. גודל הממד השני הוא 1 עבור לוגיטים חד-ממדיים, אך יהיה גדול יותר עבור בעיות מרובות מחלקות. ראה למעלה לפרטים כמו צורות וגדלים.

NodeIds של פלט ציבורי <Integer> ()

טנסור דרגה 1 המציין מזהי צומת מפוצלים אפשריים עבור כל תכונה. אורך הרשימה הוא num_features, אך לכל טנזור יש גודל שונה מכיוון שכל תכונה מספקת צמתים אפשריים שונים. ראה למעלה לפרטים כמו צורות וגדלים.

פלט ציבורי <Float> rightNodeContribs ()

טנסור דרגה 2, עם אותם צורה/תנאים כמו left_node_contribs_list, אבל רק שהערך הוא עבור הצומת הימני.

פלט ציבורי <String> splitWithDefaultDirections ()

טנסור דרגה 1 המציין לאיזה כיוון ללכת אם חסרים נתונים. ראה למעלה לפרטים כמו צורות וגדלים. אי שוויון עם ברירת מחדל שמאל מחזיר 0, אי שוויון עם ברירת מחדל ימין מחזיר 1, שוויון עם ברירת מחדל ימין מחזיר 2.

ספי <Integer> פלט ציבורי ()

טנסור דרגה 1 המציין את מזהה הדלי שיש להשוות איתו (כסף) לפיצול בכל צומת. ראה למעלה לפרטים כמו צורות וגדלים.