BlockLSTMGrad

classe finale pubblica BlockLSTMGrad

Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.

Questa implementazione deve essere utilizzata insieme a LSTMBlock.

Metodi pubblici

Uscita <T>
bGrad ()
La pendenza per w deve essere sostenuta.
static <T estende il numero> BlockLSTMGrad <T>
create ( Scope scope, Operand <Long> seqLenMax, Operand <T> x, Operand <T> csPrev, Operand <T> hPrev, Operand <T> w, Operand <T> wci, Operand <T> wcf, Operand <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole)
Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGrad.
Uscita <T>
csPrevGrad ()
Il gradiente di cs_prev da sostenere.
Uscita <T>
hPrevGrad ()
Il gradiente di h_prev da sostenere.
Uscita <T>
wGrad ()
La pendenza per w deve essere sostenuta.
Uscita <T>
wcfGrad ()
La pendenza per il wcf da sostenere.
Uscita <T>
wciGrad ()
Il gradiente per cui wci deve essere sostenuto.
Uscita <T>
wcoGrad ()
La pendenza per wco da sostenere.
Uscita <T>
xGrad ()
Il gradiente di x da sostenere.

Metodi ereditati

Metodi pubblici

output pubblico <T> bGrad ()

La pendenza per w deve essere sostenuta.

public static BlockLSTMGrad <T> create ( ambito ambito, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole)

Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGrad.

Parametri
scopo ambito attuale
seqLenMax Durata massima effettivamente utilizzata da questo ingresso. Gli output vengono riempiti con zeri oltre questa lunghezza.
X L'input della sequenza a LSTM, shape (timelen, batch_size, num_inputs).
csPrev Valore dello stato iniziale della cella.
hPrev Uscita iniziale della cella (da utilizzare per lo spioncino).
w La matrice del peso.
wci La matrice del peso per la connessione dello spioncino del gate di ingresso.
wcf La matrice di peso per la connessione di spioncino dimentica cancello.
wco La matrice del peso per la connessione dello spioncino del gate di uscita.
b Il vettore di bias.
io Il gate di input per l'intera sequenza temporale.
cs Lo stato della cellula prima del tanh durante l'intera sequenza temporale.
f Il cancello del dimenticatoio durante l'intera sequenza temporale.
o La porta di uscita per l'intera sequenza temporale.
ci L'input della cella durante l'intera sequenza temporale.
co La cella dopo il tanh durante l'intera sequenza temporale.
h Il vettore h di output sull'intera sequenza temporale.
csGrad L'attuale gradiente di cs.
hGrad Il gradiente del vettore h.
usePeephole Se usare pesi spioncino.
ritorna
  • una nuova istanza di BlockLSTMGrad

output pubblico <T> csPrevGrad ()

Il gradiente di cs_prev da sostenere.

output pubblico <T> hPrevGrad ()

Il gradiente di h_prev da sostenere.

output pubblico <T> wGrad ()

La pendenza per w deve essere sostenuta.

output pubblico <T> wcfGrad ()

La pendenza per il wcf da sostenere.

output pubblico <T> wciGrad ()

Il gradiente per cui wci deve essere sostenuto.

output pubblico <T> wcoGrad ()

La pendenza per wco da sostenere.

output pubblico <T> xGrad ()

Il gradiente di x da sostenere.