CTCLossV2

public final class CTCLossV2

Calcula a perda de CTC (probabilidade de log) para cada entrada de lote. Também calcula

o gradiente. Esta classe realiza a operação softmax para você, então as entradas devem ser, por exemplo, projeções lineares de saídas por um LSTM.

Classes aninhadas

classe CTCLossV2.Options Atributos opcionais para CTCLossV2

Métodos Públicos

estática CTCLossV2
criar ( Scope escopo, Operando <float> insumos, Operando <longo> labelsIndices, Operando <inteiro> labelsValues, Operando <Integer> sequenceLength, Options ... Opções)
Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.
estáticos CTCLossV2.Options
ctcMergeRepeated (booleano ctcMergeRepeated)
Output <float>
gradiente ()
O gradiente de `perda`.
estáticos CTCLossV2.Options
ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)
Output <float>
perda ()
Um vetor (lote) contendo log-probabilidades.
estáticos CTCLossV2.Options
preprocessCollapseRepeated (booleano preprocessCollapseRepeated)

Métodos herdados

Métodos Públicos

public static CTCLossV2 criar ( Scope escopo, Operando <float> entradas, Operando <longo> labelsIndices, Operando <Integer> labelsValues, Operando <Integer> sequenceLength, Options ... Opções)

Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.

Parâmetros
alcance escopo atual
entradas 3-D, forma: `(max_time x batch_size x num_classes)`, os logits. O rótulo em branco padrão é 0, em vez de num_classes - 1.
labelsIndices Os índices de um `SparseTensor `. `labels_indices (i, :) == [b, t]` significa `labels_values ​​(i)` armazena o id para `(lote b, tempo t)`.
labelsValues Os valores (rótulos) associados ao lote e hora fornecidos.
sequenceLength Um vetor contendo comprimentos de sequência (lote).
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de CTCLossV2

public static CTCLossV2.Options ctcMergeRepeated (Boolean ctcMergeRepeated)

Parâmetros
ctcMergeRepeated Escalar. Se definido como false, durante o cálculo CTC repetido etiquetas não em branco não serão mesclados e são interpretadas como etiquetas individuais. Esta é uma versão simplificada do CTC.

pública Output <float> gradiente ()

O gradiente de `perda`. 3-D, forma: `(max_time x batch_size x num_classes)`.

public static CTCLossV2.Options ignoreLongerOutputsThanInputs (boolean ignoreLongerOutputsThanInputs)

Parâmetros
ignoreLongerOutputsThanInputs Escalar. Se definido como verdadeiro, durante o cálculo do CTC, os itens que têm sequências de saída mais longas do que as sequências de entrada são ignorados: eles não contribuem para o termo de perda e têm gradiente zero.

pública Output <float> perda de ()

Um vetor (lote) contendo log-probabilidades.

public static CTCLossV2.Options preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Parâmetros
preprocessCollapseRepeated Escalar, se verdadeiro, então os rótulos repetidos são recolhidos antes do cálculo do CTC.