Esegue la decodifica greedy sui logit forniti negli input.
Una nota sull'attributo merge_repeated: se abilitato, quando gli indici massimi dei logit consecutivi sono uguali, viene emesso solo il primo di questi. Etichettando lo spazio vuoto '*', la sequenza "ABB * BB" diventa "ABB" se merge_repeated = True e "ABBBB" se merge_repeated = False.
Indipendentemente dal valore di merge_repeated, se l'indice massimo di un dato tempo e batch corrisponde allo spazio vuoto, indice `(num_classes - 1)`, non viene emesso alcun nuovo elemento.
Classi nidificate
classe | CtcGreedyDecoder.Options | Attributi facoltativi per CtcGreedyDecoder |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
statico <T estende TNumber > CtcGreedyDecoder <T> | |
Uscita < TInt64 > | indici decodificati () Matrice di indici, dimensione `(total_decoded_outputs x 2)`, di uno `SparseTensor |
Uscita < TInt64 > | forma decodificata () Vettore di forma, dimensione `(2)`, dello SparseTensor decodificato. |
Uscita < TInt64 > | valori decodificati () Vettore di valori, dimensione: `(total_decoded_outputs)`, di uno `SparseTensor |
Uscita <T> | logProbabilità () Matrice, dimensione "(batch_size x 1)", contenente le probabilità logaritmiche della sequenza. |
CtcGreedyDecoder.Options statico | mergeRepeated (merge booleanoRepeated) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
public static CtcGreedyDecoder <T> create ( scope scope, operando <T> input, operando < TInt32 > sequenceLength, opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione CtcGreedyDecoder.
Parametri
scopo | ambito attuale |
---|---|
input | 3-D, forma: `(max_time x batch_size x num_classes)`, i logit. |
sequenzaLength | Un vettore contenente lunghezze di sequenza, dimensione "(batch_size)". |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di CtcGreedyDecoder
output pubblico < TInt64 > decodedIndices ()
Matrice di indici, dimensione `(total_decoded_outputs x 2)`, di uno `SparseTensor
output pubblico < TInt64 > decodedShape ()
Vettore di forma, dimensione `(2)`, dello SparseTensor decodificato. I valori sono: `[batch_size, max_decoded_length]`.
output pubblico < TInt64 > decodedValues ()
Vettore di valori, dimensione: `(total_decoded_outputs)`, di uno `SparseTensor
Output pubblico <T> logProbability ()
Matrice, dimensione "(batch_size x 1)", contenente le probabilità logaritmiche della sequenza.
public static CtcGreedyDecoder.Options mergeRepeated (mergeRepeated booleano)
Parametri
mergeRipetuto | Se True, unisci le classi ripetute nell'output. |
---|