CTLossV2

classe finale pubblica CTCLossV2

Calcola la perdita CTC (probabilità logaritmica) per ciascuna voce batch. Calcola anche

il gradiente. Questa classe esegue l'operazione softmax per te, quindi gli input dovrebbero essere, ad esempio, proiezioni lineari degli output di un LSTM.

Classi nidificate

classe CTLossV2.Options Attributi facoltativi per CTCLossV2

Metodi pubblici

CTLClossV2 statico
create (ambito dell'ambito , input dell'operando <Float>, operando <Long> labelIndices, operando <Integer> labelValues, operando <Integer> sequenceLength, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione CTLClossV2.
CTLossV2.Options statico
ctcMergeRepeated (booleano ctcMergeRepeated)
Uscita <Mobile>
gradiente ()
Il gradiente di "perdita".
CTLossV2.Options statico
ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)
Uscita <Mobile>
perdita ()
Un vettore (batch) contenente le probabilità logaritmiche.
CTLossV2.Options statico
preprocessCollapseRepeated (preprocessCollapseRepeated booleano)

Metodi ereditati

Metodi pubblici

creazione pubblica statica CTLClossV2 (ambito ambito , ingressi operando <Float>, operando <Long> labelIndices, operando <Integer> labelValues, operando <Integer> sequenceLength, Opzioni... opzioni)

Metodo factory per creare una classe che racchiude una nuova operazione CTLClossV2.

Parametri
scopo ambito attuale
input 3-D, forma: `(max_time x batch_size x num_classes)`, i logit. L'etichetta vuota predefinita è 0 anziché num_classes - 1.
etichetteIndici Gli indici di uno `SparseTensor `. "labels_indices(i, :) == [b, t]" significa che "labels_values(i)" memorizza l'id per "(batch b, time t)".
etichetteValori I valori (etichette) associati al batch e all'ora specificati.
sequenzaLength Un vettore contenente lunghezze di sequenza (batch).
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di CTLossV2

public static CTLClossV2.Options ctcMergeRepeated (Booleano ctcMergeRepeated)

Parametri
ctcMergeRepeated Scalare. Se impostato su false, durante il calcolo CTC le etichette ripetute non vuote non verranno unite e verranno interpretate come etichette individuali. Questa è una versione semplificata di CTC.

gradiente di output pubblico <Float> ()

Il gradiente di "perdita". 3-D, forma: "(max_time x batch_size x num_classes)".

pubblico statico CTLClossV2.Options ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)

Parametri
ignoraLongerOutputsThanInputs Scalare. Se impostato su true, durante il calcolo CTC, gli elementi che hanno sequenze di output più lunghe rispetto alle sequenze di input vengono saltati: non contribuiscono al termine di perdita e hanno gradiente zero.

perdita pubblica <Float> di uscita ()

Un vettore (batch) contenente le probabilità logaritmiche.

public static CTLClossV2.Options preprocessCollapseRepeated (preprocessCollapseRepeated booleano)

Parametri
preprocessCollapseRepeated Scalare, se vero, le etichette ripetute vengono compresse prima del calcolo CTC.