classe finale pubblica BlockLSTMGradV2
Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.
Questa implementazione deve essere utilizzata insieme a BlockLSTMV2.
Metodi pubblici
Uscita <T> | bGrad () La pendenza per w deve essere sostenuta. |
static <T estende il numero> BlockLSTMGradV2 <T> | create ( ambito ambito, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole) Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGradV2. |
Uscita <T> | csPrevGrad () Il gradiente di cs_prev da sostenere. |
Uscita <T> | hPrevGrad () Il gradiente di h_prev da sostenere. |
Uscita <T> | wGrad () La pendenza per w deve essere sostenuta. |
Uscita <T> | wcfGrad () La pendenza per il wcf da sostenere. |
Uscita <T> | wciGrad () Il gradiente per cui wci deve essere sostenuto. |
Uscita <T> | wcoGrad () La pendenza per la wco da sostenere. |
Uscita <T> | xGrad () Il gradiente di x da sostenere. |
Metodi ereditati
Metodi pubblici
public static BlockLSTMGradV2 <T> create ( Scope scope, Operand <Long> seqLenMax, Operand <T> x, Operand <T> csPrev, Operand <T> hPrev, Operand <T> w, Operand <T> wci, Operand <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, Boolean usePeephole)
Metodo Factory per creare una classe che avvolge una nuova operazione BlockLSTMGradV2.
Parametri
scopo | ambito attuale |
---|---|
seqLenMax | Durata massima effettivamente utilizzata da questo ingresso. Gli output vengono riempiti con zeri oltre questa lunghezza. |
X | L'input della sequenza a LSTM, shape (timelen, batch_size, num_inputs). |
csPrev | Valore dello stato iniziale della cella. |
hPrev | Uscita iniziale della cella (da utilizzare per lo spioncino). |
w | La matrice del peso. |
wci | La matrice del peso per la connessione dello spioncino del gate di ingresso. |
wcf | La matrice di peso per la connessione di spioncino dimenticare gate. |
wco | La matrice del peso per la connessione dello spioncino del gate di uscita. |
b | Il vettore di bias. |
io | Il gate di input per l'intera sequenza temporale. |
cs | Lo stato della cella prima del tanh durante l'intera sequenza temporale. |
f | Il cancello del dimenticatoio durante l'intera sequenza temporale. |
o | La porta di uscita per l'intera sequenza temporale. |
ci | L'input della cella durante l'intera sequenza temporale. |
co | La cella dopo il tanh durante l'intera sequenza temporale. |
h | Il vettore h di output sull'intera sequenza temporale. |
csGrad | L'attuale gradiente di cs. |
hGrad | Il gradiente del vettore h. |
usePeephole | Se usare pesi spioncino. |
ritorna
- una nuova istanza di BlockLSTMGradV2