BoostedTreesSparseCalculateBestFeatureSplit

공개 최종 클래스 BoostedTreesSparseCalculateBestFeatureSplit

각 기능에 대한 이득을 계산하고 기능에 대해 가능한 최상의 분할 정보를 반환합니다.

분할 정보는 각 기능에 대한 노드당 최상의 임계값(버킷 ID), 이득 및 왼쪽/오른쪽 노드 기여도입니다.

각 기능에서 모든 노드를 분할할 수는 없을 수도 있습니다. 따라서 가능한 노드 목록은 기능마다 다를 수 있습니다. 따라서 이 기능을 사용하여 분할할 수 있는 노드 목록이 포함된 각 기능에 대해 'node_ids_list'를 반환합니다.

이러한 방식으로 출력은 기능별 및 노드별로 최상의 분할이므로 나중에 결합하여 (가능한 모든 기능 중에서) 각 노드에 대해 최상의 분할을 생성해야 합니다.

출력 형태는 모든 텐서의 첫 번째 차원이 동일하고 각 기능에 대해 가능한 분할 노드 수와 동일한 방식으로 호환됩니다.

중첩 클래스

수업 BoostedTreesSparseCalculateBestFeatureSplit.Options BoostedTreesSparseCalculateBestFeatureSplit 의 선택적 속성

공개 방법

정적 BoostedTreesSparseCalculateBestFeatureSplit
create ( Scope 범위, Operand <Integer> nodeIdRange, Operand <Integer> statsSummaryIndices, Operand <Float> statsSummaryValues, Operand <Integer> statsSummaryShape, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity, Operand <Float > minNodeWeight, Long logitsDimension, 옵션... 옵션)
새로운 BoostedTreesSparseCalculateBestFeatureSplit 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
출력 <정수>
기능크기 ()
각 노드에 대해 분할할 각 특성에 대한 최상의 특성 차원을 나타내는 순위 1 텐서.
출력 <플로트>
이득 ()
각 노드를 분할하는 데 필요한 최고의 이득을 나타내는 순위 1 텐서.
출력 <플로트>
leftNodeContribs ()
각 특성에 대해 지정된 임계값만큼 상위 노드에서 왼쪽 방향으로 분기할 때 왼쪽 노드의 기여도를 나타내는 순위 2 텐서입니다.
출력 <정수>
노드 ID ()
분할될 수 있는 가능한 노드 ID를 나타내는 순위 1 텐서.
출력 <플로트>
rightNodeContribs ()
left_node_contribs_list와 동일한 모양/조건을 갖는 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.
정적 BoostedTreesSparseCalculateBestFeatureSplit.Options
분할 유형 (문자열 분할 유형)
출력 <문자열>
SplitWithDefaultDirections ()
데이터가 누락된 경우 이동할 방향을 나타내는 순위 1 텐서입니다.
출력 <정수>
임계값 ()
각 노드의 분할에 대해 (임계값으로) 비교할 버킷 ID를 나타내는 순위 1 텐서입니다.

상속된 메서드

공개 방법

public static BoostedTreesSparseCalculateBestFeatureSplit create ( Scope 범위, Operand <Integer> nodeIdRange, Operand <Integer> statsSummaryIndices, Operand <Float> statsSummaryValues, Operand <Integer> statsSummaryShape, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity, 피연산자 <Float> minNodeWeight, Long logitsDimension, 옵션... 옵션)

새로운 BoostedTreesSparseCalculateBestFeatureSplit 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
nodeIdRange `stats_summary_list` 내에서 처리할 노드 ID의 범위[첫 번째, 마지막)를 지정하는 순위 1 텐서(모양=[2]). 노드는 'for node_id in range(node_id_range[0], node_id_range[1])'처럼 텐서에 의해 지정된 두 노드 사이에서 반복됩니다(마지막 인덱스 node_id_range[1]은 제외됩니다).
통계요약지수 각 기능의 버킷당 노드당 누적 통계 요약(그라데이션/헤시안)에 대한 밀집 형태 [N, 4](N은 0이 아닌 값의 수를 지정)의 순위 2 int64 텐서입니다. 두 번째 차원에는 노드 ID, 기능 차원, 버킷 ID 및 통계 희미가 포함됩니다. stats 희미함은 로짓 차원과 헤세 차원의 합이며, 헤세 차원은 대각선 헤세를 사용하는 경우 로지트 차원일 수 있고, 전체 헤세를 사용하는 경우 로지트 차원^2일 수 있습니다.
통계요약값 summary_indices의 각 요소에 대한 값을 제공하는 조밀한 형태 [N](N은 0이 아닌 값의 수를 지정)의 순위 1 부동 텐서입니다.
통계요약모양 희소 텐서의 조밀한 형태를 지정하는 조밀한 형태의 랭크 1 부동 텐서[4], 즉 [트리 노드 수, 기능 차원, 버킷 수, 통계 희미].
l1 l1 인스턴스 기반 리프 가중치에 대한 정규화 인자.
l2 l2 인스턴스 기반 리프 가중치에 대한 정규화 인자입니다.
트리복잡성 리프별로 이득을 조정합니다.
minNodeWeight 노드 분할을 고려하기 전에 노드에 있는 헤센의 최소 평균입니다.
로지트차원 로짓의 차원, 즉 클래스 수.
옵션 선택적 속성 값을 전달합니다.
보고
  • BoostedTreesSparseCalculateBestFeatureSplit의 새로운 인스턴스

공개 출력 <Integer> featureDimensions ()

각 노드에 대해 분할할 각 특성에 대한 최상의 특성 차원을 나타내는 순위 1 텐서.

공개 출력 <Float> 이득 ()

각 노드를 분할하는 데 필요한 최고의 이득을 나타내는 순위 1 텐서.

공개 출력 <Float> leftNodeContribs ()

각 특성에 대해 지정된 임계값만큼 상위 노드에서 왼쪽 방향으로 분기할 때 왼쪽 노드의 기여도를 나타내는 순위 2 텐서입니다. 이 값은 부모 노드 값에 더해 왼쪽 노드 값을 만드는 데 사용됩니다. 두 번째 차원 크기는 로지트 차원입니다.

공개 출력 <Integer> nodeIds ()

분할될 수 있는 가능한 노드 ID를 나타내는 순위 1 텐서.

공개 출력 <Float> rightNodeContribs ()

left_node_contribs_list와 동일한 모양/조건을 갖는 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.

공개 정적 BoostedTreesSparseCalculateBestFeatureSplit.Options 분할 유형 (문자열 분할 유형)

매개변수
분할 유형 이 작업이 불일치 분할을 수행해야 하는지 또는 동등 분할을 수행해야 하는지를 나타내는 문자열입니다.

공개 출력 <String> SplitWithDefaultDirections ()

데이터가 누락된 경우 이동할 방향을 나타내는 순위 1 텐서입니다. 기본 왼쪽과의 부등식은 0을 반환하고, 기본 오른쪽과의 부등식은 1을 반환하며, 기본 오른쪽과의 동일성은 2를 반환합니다.

공개 출력 <Integer> 임계값 ()

각 노드의 분할에 대해 (임계값으로) 비교할 버킷 ID를 나타내는 순위 1 텐서입니다.