BoostedTreesSparseCalculateBestFeatureSplit

classe final pública BoostedTreesSparseCalculateBestFeatureSplit

Calcula os ganhos para cada recurso e retorna as melhores informações de divisão possíveis para o recurso.

As informações divididas são o melhor limite (id do bucket), ganhos e contribuições do nó esquerdo/direito por nó para cada recurso.

É possível que nem todos os nós possam ser divididos em cada recurso. Conseqüentemente, a lista de nós possíveis pode diferir entre os recursos. Portanto, retornamos `node_ids_list` para cada recurso, contendo a lista de nós que este recurso pode ser usado para dividir.

Desta forma, a saída é a melhor divisão por características e por nó, de modo que precisa ser combinada posteriormente para produzir a melhor divisão para cada nó (entre todas as características possíveis).

As formas de saída são compatíveis de forma que a primeira dimensão de todos os tensores seja a mesma e igual ao número de nós de divisão possíveis para cada recurso.

Classes aninhadas

aula BoostedTreesSparseCalculateBestFeatureSplit.Options Atributos opcionais para BoostedTreesSparseCalculateBestFeatureSplit

Métodos Públicos

estática BoostedTreesSparseCalculateBestFeatureSplit
create ( Escopo do escopo , Operando <Integer> nodeIdRange, Operando <Integer> statsSummaryIndices, Operando <Float> statsSummaryValues, Operando <Integer> statsSummaryShape, Operando <Float> l1, Operando <Float> l2, Operando <Float> treeComplexity, Operando <Float > minNodeWeight, Long logitsDimension, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação BoostedTreesSparseCalculateBestFeatureSplit.
Saída <Inteiro>
recursoDimensões ()
Um tensor de classificação 1 indicando a melhor dimensão de recurso para cada recurso a ser dividido para cada nó.
Saída <flutuante>
ganhos ()
Um tensor de Rank 1 indicando os melhores ganhos para dividir cada nó.
Saída <flutuante>
leftNodeContribs ()
Um tensor de classificação 2 que indica a contribuição dos nós esquerdos ao ramificar dos nós pais para a direção esquerda pelo limite fornecido para cada recurso.
Saída <Inteiro>
nodeIds ()
Um tensor de classificação 1 indicando possíveis IDs de nós que podem ser divididos.
Saída <flutuante>
rightNodeContribs ()
Um tensor de classificação 2, com a mesma forma/condições que left_node_contribs_list, mas apenas que o valor é para o nó direito.
estática BoostedTreesSparseCalculateBestFeatureSplit.Options
splitType (String splitType)
Saída <String>
splitWithDefaultDirections ()
Um tensor de classificação 1 indicando qual direção seguir se faltarem dados.
Saída <Inteiro>
limites ()
Um tensor de classificação 1 indicando o ID do bucket para comparar (como um limite) para divisão em cada nó.

Métodos herdados

Métodos Públicos

public static BoostedTreesSparseCalculateBestFeatureSplit create ( Escopo escopo , Operando <Integer> nodeIdRange, Operando <Integer> statsSummaryIndices, Operando <Float> statsSummaryValues, Operando <Integer> statsSummaryShape, Operando <Float> l1, Operando <Float> l2, Operando <Float> treeComplexity, Operando <Float> minNodeWeight, Long logitsDimension, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação BoostedTreesSparseCalculateBestFeatureSplit.

Parâmetros
escopo escopo atual
nodeIdRange Um tensor de classificação 1 (shape=[2]) para especificar o intervalo [primeiro, último) de IDs de nó a serem processados ​​em `stats_summary_list`. Os nós são iterados entre os dois nós especificados pelo tensor, como `for node_id in range(node_id_range[0], node_id_range[1])` (Observe que o último índice node_id_range[1] é exclusivo).
estatísticasSummaryIndices Um tensor int64 de classificação 2 de forma densa [N, 4] (N especifica o número de valores diferentes de zero) para resumo de estatísticas acumuladas (gradiente/hessian) por nó por balde para cada recurso. A segunda dimensão contém ID do nó, dimensão do recurso, ID do bucket e estatísticas dim. stats dim é a soma da dimensão logits e da dimensão hessiana, a dimensão hessiana pode ser a dimensão logits se a diagonal hessiana for usada ou a dimensão logits ^ 2 se a hessiana completa for usada.
estatísticasResumoValores Um tensor flutuante de classificação 1 de formato denso [N] (N especifica o número de valores diferentes de zero), que fornece os valores para cada elemento em summary_indices.
estatísticasResumoForma Um tensor flutuante de classificação 1 de forma densa [4], que especifica a forma densa do tensor esparso, que é [num tree nodes, feature dimensions, num buckets, stats dim].
l1 l1 fator de regularização nos pesos das folhas, com base em instância.
l2 Fator de regularização l2 nos pesos das folhas, com base em instância.
árvoreComplexidade ajuste ao ganho, por folha.
minNodePeso média mínima de hessianas em um nó antes necessária para que o nó seja considerado para divisão.
logitsDimensão A dimensão do logit, ou seja, número de classes.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de BoostedTreesSparseCalculateBestFeatureSplit

saída pública <inteiro> featureDimensions ()

Um tensor de classificação 1 indicando a melhor dimensão de recurso para cada recurso a ser dividido para cada nó.

ganhos de saída pública <Float> ()

Um tensor de Rank 1 indicando os melhores ganhos para dividir cada nó.

Saída pública <Float> leftNodeContribs ()

Um tensor de classificação 2 que indica a contribuição dos nós esquerdos ao ramificar dos nós pais para a direção esquerda pelo limite fornecido para cada recurso. Este valor será usado para criar o valor do nó esquerdo, adicionando ao valor do nó pai. O tamanho da segunda dimensão é a dimensão logits.

Saída pública <Inteiro> nodeIds ()

Um tensor de classificação 1 indicando possíveis IDs de nós que podem ser divididos.

Saída pública <Float> rightNodeContribs ()

Um tensor de classificação 2, com a mesma forma/condições que left_node_contribs_list, mas apenas que o valor é para o nó direito.

público estático BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (String splitType)

Parâmetros
splitType Uma string indicando se este Op deve realizar divisão de desigualdade ou divisão de igualdade.

Saída pública <String> splitWithDefaultDirections ()

Um tensor de classificação 1 indicando qual direção seguir se faltarem dados. A desigualdade com o padrão à esquerda retorna 0, a desigualdade com o padrão à direita retorna 1, a igualdade com o padrão à direita retorna 2.

Limites de saída pública <inteiro> ()

Um tensor de classificação 1 indicando o ID do bucket para comparar (como um limite) para divisão em cada nó.