clase final pública BlockLSTMGradV2
Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.
Esta implementación se utilizará junto con BlockLSTMV2.
Métodos públicos
Salida <T> | bgrado () El degradado para que w esté apuntalado hacia atrás. |
estático <T extiende Número> BlockLSTMGradV2 <T> | create ( Scope scope, Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co, Operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Boolean useMirilla) Método de fábrica para crear una clase que envuelve una nueva operación BlockLSTMGradV2. |
Salida <T> | csPrevGrad () El degradado de cs_prev para respaldar. |
Salida <T> | hPrevGrad () El degradado de h_prev se apuntalará hacia atrás. |
Salida <T> | Graduado () El degradado para que w esté apuntalado hacia atrás. |
Salida <T> | wcfGrad () El degradado para que wcf sea apuntalado hacia atrás. |
Salida <T> | wciGrado () El degradado para que wci esté apuntalado hacia atrás. |
Salida <T> | wcoGrad () El gradiente para que wco se apoye en la parte posterior. |
Salida <T> | xGrad () El gradiente de x para respaldar. |
Métodos Heredados
Métodos públicos
public static BlockLSTMGradV2 <T> create ( Ámbito ámbito, Operando <Largo> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T > wcf, Operando <T> wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, Boolean useMirilla)
Método de fábrica para crear una clase que envuelve una nueva operación BlockLSTMGradV2.
Parámetros
alcance | alcance actual |
---|---|
seqLenMax | Duración máxima utilizada realmente por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud. |
X | La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs). |
csAnterior | Valor del estado inicial de la celda. |
hAnterior | Salida inicial de celular (para ser usado para mirilla). |
w | La matriz de peso. |
wci | La matriz de peso para la conexión de la mirilla de la puerta de entrada. |
wcf | La matriz de peso para la conexión de mirilla de puerta olvidada. |
wco | La matriz de peso para la conexión de la mirilla de la puerta de salida. |
b | El vector de sesgo. |
i | La puerta de entrada durante toda la secuencia de tiempo. |
cs | El estado de la celda antes del tanh durante toda la secuencia de tiempo. |
F | La puerta del olvido sobre toda la secuencia de tiempo. |
o | La puerta de salida durante toda la secuencia de tiempo. |
ci | La entrada de la celda durante toda la secuencia de tiempo. |
co | La celda después del tanh durante toda la secuencia de tiempo. |
h | El vector h de salida durante toda la secuencia de tiempo. |
csGrad | El gradiente actual de cs. |
Graduado | El gradiente del vector h. |
utilizarMirilla | Ya sea para usar pesos de mirilla. |
Devoluciones
- una nueva instancia de BlockLSTMGradV2