Clase public final BlockLSTMGrad
Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.
Esta implementación se utilizará junto con BlockLSTMV2.
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
Salida <T> | bgrad () El gradiente de w se apoyará hacia atrás. |
estática <T se extiende TNumber > BlockLSTMGrad <T> | crear ( Alcance alcance, operando < TInt64 > seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> WCF, operando <T > OMA, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> O, operando <T> ci, operando <T> co, operando <T> h , operando <T> csGrad, operando <T> hGrad, Boolean usePeephole) Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad. |
Salida <T> | csPrevGrad () El gradiente de cs_prev que se respaldará. |
Salida <T> | hPrevGrad () El gradiente de h_prev que se apoyará hacia atrás. |
Salida <T> | wGrad () El gradiente de w se apoyará hacia atrás. |
Salida <T> | wcfGrad () El gradiente para que el wcf esté apoyado hacia atrás. |
Salida <T> | wciGrad () El gradiente para que wci se apoye hacia atrás. |
Salida <T> | wcoGrad () El gradiente para que wco sea apoyado hacia atrás. |
Salida <T> | xGrad () El gradiente de x que se apoyará hacia atrás. |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Valor constante: "BlockLSTMGradV2"
Métodos públicos
public static BlockLSTMGrad <T> crear ( Alcance alcance, operando < TInt64 > seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T > WCF, operando <T> OMA, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> O, operando <T> ci, operando <T> co , operando <T> h, operando <T> csGrad, operando <T> hGrad, Boolean usePeephole)
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad.
Parámetros
alcance | alcance actual |
---|---|
seqLenMax | Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud. |
X | La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs). |
csPrev | Valor del estado inicial de la celda. |
hPrev | Salida inicial de celda (para ser utilizada como mirilla). |
w | La matriz de peso. |
wci | La matriz de peso para la conexión de mirilla de la puerta de entrada. |
WC | La matriz de peso para la conexión de mirilla de puerta olvidada. |
wco | La matriz de peso para la conexión de mirilla de la puerta de salida. |
B | El vector de sesgo. |
I | La puerta de entrada en toda la secuencia de tiempo. |
cs | El estado de la celda antes del tanh durante toda la secuencia de tiempo. |
F | La puerta del olvido en toda la secuencia de tiempo. |
o | La puerta de salida en toda la secuencia de tiempo. |
ci | La entrada de la celda durante toda la secuencia de tiempo. |
co | La celda después del tanh durante toda la secuencia de tiempo. |
h | El vector h de salida en toda la secuencia de tiempo. |
csGrad | El gradiente actual de cs. |
hGrad | El gradiente del vector h. |
utilizar mirilla | Ya sea para usar pesas de mirilla. |
Devoluciones
- una nueva instancia de BlockLSTMGrad