CtcGreedyDecoder

CtcGreedyDecoder public final class

Realiza decodificación codiciosa en los logits dados en las entradas.

Una nota sobre el atributo merge_repeated: si está habilitado, cuando los índices máximos de logits consecutivos son iguales, solo se emite el primero de ellos. Al etiquetar el espacio en blanco '*', la secuencia "ABB * BB" se convierte en "ABB" si merge_repeated = True y "ABBBB" si merge_repeated = False.

Independientemente del valor de merge_repeated, si el índice máximo de un tiempo y lote dado corresponde al índice en blanco `(num_classes - 1)`, no se emite ningún elemento nuevo.

Clases anidadas

clase CtcGreedyDecoder.Options Los atributos opcionales para CtcGreedyDecoder

Constantes

Cuerda OP_NAME El nombre de esta operación, como lo conoce el motor central de TensorFlow

Métodos públicos

estática <T se extiende TNumber > CtcGreedyDecoder <T>
crear ( Alcance alcance, operando <T> entradas, operando < TInt32 > sequenceLength, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación CtcGreedyDecoder.
Salida < TInt64 >
decodedIndices ()
Matriz de índices, tamaño `(total_decoded_outputs x 2)`, de un `SparseTensor ".
Salida < TInt64 >
decodedShape ()
Vector de forma, tamaño `(2)`, del SparseTensor decodificado.
Salida < TInt64 >
decodedValues ()
Vector de valores, tamaño: `(total_decoded_outputs)`, de un `SparseTensor ".
Salida <T>
logProbability ()
Matriz, tamaño `(batch_size x 1)`, que contiene las probabilidades de registro de secuencia.
estáticas CtcGreedyDecoder.Options
mergeRepeated (Boolean mergeRepeated)

Métodos heredados

Constantes

OP_NAME pública final static String

El nombre de esta operación, como lo conoce el motor central de TensorFlow

Valor constante: "CTCGreedyDecoder"

Métodos públicos

public static CtcGreedyDecoder <T> crear ( Alcance alcance, operando <T> entradas, operando < TInt32 > sequenceLength, Opciones ... Opciones)

Método de fábrica para crear una clase que envuelva una nueva operación CtcGreedyDecoder.

Parámetros
alcance alcance actual
entradas 3-D, forma: `(max_time x batch_size x num_classes)`, los logits.
secuenciaLongitud Un vector que contiene longitudes de secuencia, tamaño `(batch_size)`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CtcGreedyDecoder

pública de salida < TInt64 > decodedIndices ()

Matriz de índices, tamaño `(total_decoded_outputs x 2)`, de un `SparseTensor ". Las filas almacenan: [lote, tiempo].

pública de salida < TInt64 > decodedShape ()

Vector de forma, tamaño `(2)`, del SparseTensor decodificado. Los valores son: `[batch_size, max_decoded_length]`.

pública de salida < TInt64 > decodedValues ()

Vector de valores, tamaño: `(total_decoded_outputs)`, de un `SparseTensor ". El vector almacena las clases decodificadas.

pública de salida <T> logProbability ()

Matriz, tamaño `(batch_size x 1)`, que contiene las probabilidades de registro de secuencia.

public static CtcGreedyDecoder.Options mergeRepeated (booleano mergeRepeated)

Parámetros
mergeRepeated Si es True, combine las clases repetidas en la salida.