BlockLSTMGradV2

classe finale pubblica BlockLSTMGradV2

Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.

Questa implementazione deve essere utilizzata insieme a BlockLSTMV2.

Metodi pubblici

Uscita <T>
bGrad ()
La pendenza per w deve essere sostenuta.
static <T estende il numero> BlockLSTMGradV2 <T>
create ( ambito ambito, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole)
Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGradV2.
Uscita <T>
csPrevGrad ()
Il gradiente di cs_prev da sostenere.
Uscita <T>
hPrevGrad ()
Il gradiente di h_prev da sostenere.
Uscita <T>
wGrad ()
La pendenza per w deve essere sostenuta.
Uscita <T>
wcfGrad ()
La pendenza per il wcf da sostenere.
Uscita <T>
wciGrad ()
Il gradiente per cui wci deve essere sostenuto.
Uscita <T>
wcoGrad ()
La pendenza per la wco da sostenere.
Uscita <T>
xGrad ()
Il gradiente di x da sostenere.

Metodi ereditati

Metodi pubblici

output pubblico <T> bGrad ()

La pendenza per w deve essere sostenuta.

public static BlockLSTMGradV2 <T> create ( Scope scope, Operand <Long> seqLenMax, Operand <T> x, Operand <T> csPrev, Operand <T> hPrev, Operand <T> w, Operand <T> wci, Operand <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole)

Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGradV2.

Parametri
scopo ambito attuale
seqLenMax Durata massima effettivamente utilizzata da questo ingresso. Gli output vengono riempiti con zeri oltre questa lunghezza.
X L'input della sequenza a LSTM, shape (timelen, batch_size, num_inputs).
csPrev Valore dello stato iniziale della cella.
hPrev Uscita iniziale della cella (da utilizzare per lo spioncino).
w La matrice del peso.
wci La matrice del peso per la connessione dello spioncino del gate di ingresso.
wcf La matrice di peso per la connessione di spioncino dimenticare gate.
wco La matrice del peso per la connessione dello spioncino del gate di uscita.
b Il vettore di bias.
io Il gate di input per l'intera sequenza temporale.
cs Lo stato della cella prima del tanh durante l'intera sequenza temporale.
f Il cancello del dimenticatoio durante l'intera sequenza temporale.
o La porta di uscita per l'intera sequenza temporale.
ci L'input della cella durante l'intera sequenza temporale.
co La cella dopo il tanh durante l'intera sequenza temporale.
h Il vettore h di output sull'intera sequenza temporale.
csGrad L'attuale gradiente di cs.
hGrad Il gradiente del vettore h.
usePeephole Se usare pesi spioncino.
ritorna
  • una nuova istanza di BlockLSTMGradV2

output pubblico <T> csPrevGrad ()

Il gradiente di cs_prev da sostenere.

output pubblico <T> hPrevGrad ()

Il gradiente di h_prev da sostenere.

output pubblico <T> wGrad ()

La pendenza per w deve essere sostenuta.

output pubblico <T> wcfGrad ()

La pendenza per il wcf da sostenere.

output pubblico <T> wciGrad ()

Il gradiente per cui wci deve essere sostenuto.

output pubblico <T> wcoGrad ()

La pendenza per la wco da sostenere.

output pubblico <T> xGrad ()

Il gradiente di x da sostenere.