BoostedTreeSparseCalculateBestFeatureSplit

공개 최종 클래스 BOSTEDTREESSPARSECALCULATEBESTFEATURSPLIT

각 기능에 대한 이득을 계산하고 기능에 대한 최상의 분할 정보를 반환합니다.

분할 정보는 각 기능에 대한 노드 당 최고의 임계 값 (버킷 ID), 이득 및 왼쪽/오른쪽 노드 기여입니다.

각 기능에서 모든 노드를 분할 할 수있는 것은 아닙니다. 따라서 가능한 노드 목록은 기능마다 다를 수 있습니다. 따라서이 기능을 분할하는 데 사용될 수있는 노드 목록을 포함하여 각 기능에 대해`node_ids_list`를 반환합니다.

이러한 방식으로, 출력은 피처 및 노드 당 최고의 분할이므로 나중에 각 노드에 대한 최고의 분할을 생성하기 위해 나중에 결합해야합니다 (가능한 모든 기능 중).

출력 모양은 모든 텐서의 첫 번째 차원이 동일하고 각 기능에 대한 가능한 분할 노드의 수와 동일하게 호환됩니다.

중첩 클래스

수업 boostedTreessParsEcalculateBestFeaturesPlit.Options BoostedTreesSparseCalculateBestFeatureSplit 의 선택적 속성

공개 방법

정적 BoostedTreessParsEcalculateBestFeaturesPlit
생성 ( 스코프 스코프, 오페라 <integer> nodeidrange, 오페라 <integer> statssummaryindices, operand <float> statssummaryvalues, operand <integer> statssummaryshape, operand <float> l1, operand <float> l2, operand > l2, treecomplexity, offerand < float > Minnodeweight, 긴 logitsdimension, 옵션 ... 옵션)
공장 방법 새로운 boostedtreessparsecalculateBestFeaturesPlit 작업을 감싸는 클래스를 생성하는 방법.
출력 <정수>
featuredimensions ()
각 기능에 대한 최상의 기능 차원을 나타내는 순위 1 텐서. 각 노드에 대해 분할됩니다.
출력 <플로트>
gains ()
각 노드를 분할하기위한 최상의 이익을 나타내는 순위 1 텐서.
출력 <플로트>
LeftNodecontribs ()
각 기능에 대한 주어진 임계 값에 의해 부모 노드에서 왼쪽 방향으로 분기 될 때 왼쪽 노드의 기여를 나타내는 순위 2 텐서.
출력 <정수>
nodeids ()
분할 할 수있는 노드 ID를 나타내는 순위 1 텐서.
출력 <플로트>
RightNodecontribs ()
Left_node_contribs_list와 동일한 모양/조건을 가진 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.
정적 BoostedTreessParsEcalculateBestFeaturesPlit.Options
splittype (String splittype)
출력 <문자열>
splitwithDefaultDirections ()
데이터가 누락 된 경우 어느 방향으로 가야하는지 나타내는 순위 1 텐서.
출력 <정수>
임계 값 ()
버킷 ID가 각 노드에서 분할의 임계 값으로 비교할 수있는 순위 1 텐서.

상속된 메서드

공개 방법

Public STATIC BOSTEDTREESSPARSCALCULATEBESTFEATURESPLIT CREATE ( SCOPE SCOPE, OPERAND <INTEGER> NODEIDRANGE, OPERAND <INTEGER> STATSSUMMARYINDICES, OPERAND > STATSSUMMARYVALUES, OPERAND <ETEGER> StatsSummaryShape, Operand > L1, Operand <L2, Operand > Operand <Float> MinnodeWeight, 긴 logitsdimension, 옵션 ... 옵션)

공장 방법 새로운 boostedtreessparsecalculateBestFeaturesPlit 작업을 감싸는 클래스를 생성하는 방법.

매개변수
범위 현재 범위
NodeIdRange `stats_summary_list` 내에서 처리 할 노드 ID의 [첫 번째, 마지막) 범위를 지정하는 순위 1 텐서 (shape = [2]). 노드는``node_id의 for node_id_range [0], node_id_range [1])와 같이 텐서가 지정한 두 노드 사이에 반복됩니다 (마지막 인덱스 node_id_range [1]은 독점적이라는 점에 유의하십시오.
STATSSUMMARYINDICES 각 기능에 대한 버킷 당 노드 당 누적 된 통계 요약 (Gradient/Hessian)에 대한 밀도가 높은 모양 [n, 4] (N, 0이 아닌 값의 수를 지정)의 순위 2 int64 텐서. 두 번째 차원에는 노드 ID, 기능 치수, 버킷 ID 및 통계가 포함됩니다. 통계 Dim은 Logits Dimension과 Hessian Dimension의 합입니다. Hessian Dimension은 Diagonal Hessian을 사용하는 경우 Logits Dimension 일 수 있거나 Logits Dimension^2 Full Hessian을 사용하는 경우 2 차원^2입니다.
STATSSUMMARYVALUES 밀도가 높은 모양 [n] (n]의 순위 1 플로트 텐서는 Summary_Indices에서 각 요소의 값을 제공합니다.
STATSSUMMARY SHAPE 조밀 한 모양의 랭크 1 플로트 텐서 [4]. [Num 트리 노드, 특징 치수, Num 버킷, 스탯 희미한 스파 스 텐서의 조밀 한 모양을 지정합니다.
l1 인스턴스 기반 잎 무게에 대한 L1 정규화 계수.
L2 인스턴스 기반 잎 무게에 대한 L2 정규화 계수.
treecomplexity 잎 기반의 게인에 대한 조정.
Minnodeweight 노드에서 분할을 고려하기 전에 노드에있는 Hessians의 최소 AVG.
logitsdimension 로이트의 차원, 즉 클래스 수.
옵션 선택적 속성 값을 전달합니다.
보고
  • BoostedTreessParsEcalculateBestFeaturesPlit의 새로운 인스턴스

공개 출력 <integer> featuredimensions ()

각 기능에 대한 최상의 기능 차원을 나타내는 순위 1 텐서. 각 노드에 대해 분할됩니다.

공개 출력 <Float> gains ()

각 노드를 분할하기위한 최상의 이익을 나타내는 순위 1 텐서.

공개 출력 <Float> leftnodecontribs ()

각 기능에 대한 주어진 임계 값에 의해 부모 노드에서 왼쪽 방향으로 분기 될 때 왼쪽 노드의 기여를 나타내는 순위 2 텐서. 이 값은 부모 노드 값에 추가하여 왼쪽 노드 값을 만드는 데 사용됩니다. 2 차원 크기는 로짓 치수입니다.

공개 출력 <integer> nodeids ()

분할 할 수있는 노드 ID를 나타내는 순위 1 텐서.

공개 출력 <Float> RightNodeContribs ()

Left_node_contribs_list와 동일한 모양/조건을 가진 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.

public static boostedtreessparsecalculatebestfeatplit.options splittype (String splittype)

매개변수
분할 유형 이 OP가 불평등 분할 또는 평등 분할을 수행 해야하는지 여부를 나타내는 문자열.

공개 출력 <string> splitwithDefaultDirections ()

데이터가 누락 된 경우 어느 방향으로 가야하는지 나타내는 순위 1 텐서. 기본값이있는 불평등은 0, 기본 오른쪽 반품 1의 불평등, 기본 오른쪽 반환의 평등 2.

공개 출력 <integer> thresholds ()

버킷 ID가 각 노드에서 분할의 임계 값으로 비교할 수있는 순위 1 텐서.