CtcGreedyDecoder

classe finale pubblica CtcGreedyDecoder

Esegue la decodifica greedy sui logit forniti negli input.

Una nota sull'attributo merge_repeated: se abilitato, quando gli indici massimi dei logit consecutivi sono uguali, viene emesso solo il primo di questi. Etichettando lo spazio vuoto '*', la sequenza "ABB * BB" diventa "ABB" se merge_repeated = True e "ABBBB" se merge_repeated = False.

Indipendentemente dal valore di merge_repeated, se l'indice massimo di un dato tempo e batch corrisponde allo spazio vuoto, indice `(num_classes - 1)`, non viene emesso alcun nuovo elemento.

Classi nidificate

classe CtcGreedyDecoder.Options Attributi facoltativi per CtcGreedyDecoder

Costanti

Corda OP_NAME Il nome di questa operazione, come noto al motore principale di TensorFlow

Metodi pubblici

statico <T estende TNumber > CtcGreedyDecoder <T>
create ( ambito ambito , ingressi operando <T>, operando < TInt32 > lunghezzasequenza, opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione CtcGreedyDecoder.
Uscita < TInt64 >
indici decodificati ()
Matrice di indici, dimensione `(total_decoded_outputs x 2)`, di uno `SparseTensor `.
Uscita < TInt64 >
forma decodificata ()
Vettore di forma, dimensione `(2)`, dello SparseTensor decodificato.
Uscita < TInt64 >
valori decodificati ()
Vettore di valori, dimensione: `(total_decoded_outputs)`, di uno `SparseTensor `.
Uscita <T>
logProbabilità ()
Matrice, dimensione "(batch_size x 1)", contenente le probabilità logaritmiche della sequenza.
CtcGreedyDecoder.Options statico
mergeRepeated (merge booleanoRepeated)

Metodi ereditati

Costanti

Stringa finale statica pubblica OP_NAME

Il nome di questa operazione, come noto al motore principale di TensorFlow

Valore costante: "CTCGreedyDecoder"

Metodi pubblici

public static CtcGreedyDecoder <T> create ( scope scope, operando <T> input, operando < TInt32 > sequenceLength, opzioni... opzioni)

Metodo factory per creare una classe che racchiude una nuova operazione CtcGreedyDecoder.

Parametri
scopo ambito attuale
input 3-D, forma: `(max_time x batch_size x num_classes)`, i logit.
sequenzaLength Un vettore contenente lunghezze di sequenza, dimensione "(batch_size)".
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di CtcGreedyDecoder

output pubblico < TInt64 > decodedIndices ()

Matrice di indici, dimensione `(total_decoded_outputs x 2)`, di uno `SparseTensor `. Le righe memorizzano: [batch, ora].

output pubblico < TInt64 > decodedShape ()

Vettore di forma, dimensione `(2)`, dello SparseTensor decodificato. I valori sono: `[batch_size, max_decoded_length]`.

output pubblico < TInt64 > decodedValues ​​()

Vettore di valori, dimensione: `(total_decoded_outputs)`, di uno `SparseTensor `. Il vettore memorizza le classi decodificate.

Output pubblico <T> logProbability ()

Matrice, dimensione "(batch_size x 1)", contenente le probabilità logaritmiche della sequenza.

public static CtcGreedyDecoder.Options mergeRepeated (mergeRepeated booleano)

Parametri
mergeRipetuto Se True, unisci le classi ripetute nell'output.