CTCLossV2

clase final pública CTCLossV2

Calcula la pérdida de CTC (probabilidad logarítmica) para cada entrada de lote. También calcula

el gradiente. Esta clase realiza la operación softmax por usted, por lo que las entradas deben ser, por ejemplo, proyecciones lineales de salidas mediante un LSTM.

Clases anidadas

clase CTCLossV2.Opciones Atributos opcionales para CTCLossV2

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

CTCLossV2 estático
crear ( alcance alcance, Operando < TFloat32 > entradas, Operando < TInt64 > etiquetasIndices, Operando < TInt32 > etiquetasValores, Operando < TInt32 > longitud de secuencia, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CTCLossV2.
CTCLossV2.Options estático
ctcMergeRepeated (ctcMergeRepeated booleano)
Salida <TFloat32>
degradado ()
El gradiente de "pérdida".
CTCLossV2.Options estático
ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)
Salida <TFloat32>
pérdida ()
Un vector (lote) que contiene probabilidades logarítmicas.
CTCLossV2.Options estático
preprocessCollapseRepeated (preproceso booleanoCollapseRepeated)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "CTCLossV2"

Métodos públicos

creación pública estática de CTCLossV2 ( alcance , operando <TFloat32> entradas, operando <TInt64> etiquetasíndices, operando <TInt32> etiquetasValores, operando <TInt32> longitud de secuencia, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación CTCLossV2.

Parámetros
alcance alcance actual
entradas 3-D, forma: `(tiempo_máximo x tamaño_de_lote x núm_clases)`, los logits. La etiqueta en blanco predeterminada es 0 en lugar de num_classes - 1.
etiquetasÍndices Los índices de un `SparseTensor `. `labels_indices(i, :) == [b, t]` significa que `labels_values(i)` almacena la identificación de `(lote b, tiempo t)`.
etiquetasValores Los valores (etiquetas) asociados con el lote y el tiempo dados.
secuenciaLongitud Un vector que contiene longitudes de secuencia (lote).
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CTCLossV2

CTCLossV2.Options estático público ctcMergeRepeated (ctcMergeRepeated booleano)

Parámetros
ctcMergeRepetido Escalar. Si se establece en falso, durante el cálculo de CTC las etiquetas repetidas que no estén en blanco no se fusionarán y se interpretarán como etiquetas individuales. Esta es una versión simplificada de CTC.

Salida pública <TFloat32> gradiente ()

El gradiente de "pérdida". 3-D, forma: `(tiempo_máximo x tamaño_de_lote x núm_clases)`.

CTCLossV2.Options estática pública ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)

Parámetros
ignorar salidas más largas que las entradas Escalar. Si se establece en verdadero, durante el cálculo de CTC, los elementos que tienen secuencias de salida más largas que las secuencias de entrada se omiten: no contribuyen al término de pérdida y tienen gradiente cero.

Salida pública <TFloat32> pérdida ()

Un vector (lote) que contiene probabilidades logarítmicas.

público estático CTCLossV2.Options preprocessCollapseRepeated (preprocessCollapseRepeated booleano)

Parámetros
preprocesoColapsoRepetido Escalar, si es verdadero, las etiquetas repetidas se contraen antes del cálculo de CTC.