BlockLSTMGradV2

clase final pública BlockLSTMGradV2

Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.

Esta implementación se utilizará junto con BlockLSTMV2.

Métodos públicos

Salida <T>
bGrad ()
El gradiente de w se apoyará hacia atrás.
estática <T extiende Número> BlockLSTMGradV2 <T>
create ( alcance de alcance, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, operando <T> hGrad, uso booleano Mirilla)
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGradV2.
Salida <T>
csPrevGrad ()
El gradiente de cs_prev que se respaldará.
Salida <T>
hPrevGrad ()
El gradiente de h_prev que se apoyará hacia atrás.
Salida <T>
wGrad ()
El gradiente de w se apoyará hacia atrás.
Salida <T>
wcfGrad ()
El gradiente para que el wcf esté apoyado hacia atrás.
Salida <T>
wciGrad ()
El gradiente para que wci se apoye hacia atrás.
Salida <T>
wcoGrad ()
El gradiente para que wco sea apoyado hacia atrás.
Salida <T>
xGrad ()
El gradiente de x que se apoyará hacia atrás.

Métodos heredados

Métodos públicos

Salida pública <T> bGrad ()

El gradiente de w se apoyará hacia atrás.

public static BlockLSTMGradV2 <T> create ( alcance de alcance, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, operando <T> csGrad, operando <T> hGrad, uso booleano

Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGradV2.

Parámetros
alcance alcance actual
seqLenMax Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud.
X La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs).
csPrev Valor del estado inicial de la celda.
hPrev Salida inicial de celda (para ser utilizada como mirilla).
w La matriz de peso.
wci La matriz de peso para la conexión de mirilla de la puerta de entrada.
WC La matriz de peso para la conexión de mirilla de puerta olvidada.
wco La matriz de peso para la conexión de mirilla de la puerta de salida.
B El vector de sesgo.
I La puerta de entrada en toda la secuencia de tiempo.
cs El estado de la celda antes del tanh durante toda la secuencia de tiempo.
F La puerta del olvido en toda la secuencia de tiempo.
o La puerta de salida en toda la secuencia de tiempo.
ci La entrada de la celda durante toda la secuencia de tiempo.
co La celda después del tanh durante toda la secuencia de tiempo.
h El vector de salida h en toda la secuencia de tiempo.
csGrad El gradiente actual de cs.
hGrad El gradiente del vector h.
utilizar mirilla Ya sea para usar pesas de mirilla.
Devoluciones
  • una nueva instancia de BlockLSTMGradV2

Salida pública <T> csPrevGrad ()

El gradiente de cs_prev que se respaldará.

Salida pública <T> hPrevGrad ()

El gradiente de h_prev que se respaldará.

Salida pública <T> wGrad ()

El gradiente de w se apoyará hacia atrás.

Salida pública <T> wcfGrad ()

El gradiente para que el wcf esté apoyado hacia atrás.

Salida pública <T> wciGrad ()

El gradiente para que wci se apoye hacia atrás.

Salida pública <T> wcoGrad ()

El gradiente para que wco sea apoyado hacia atrás.

Salida pública <T> xGrad ()

El gradiente de x que se apoyará hacia atrás.