BlockLSTMGrad

publiczna klasa końcowa BlockLSTMGrad

Oblicza propagację wsteczną komórki LSTM dla całej sekwencji czasowej.

Ta implementacja ma być używana w połączeniu z LSTMBlock.

Metody publiczne

Wyjście <T>
bGrad ()
Nachylenie dla w, które ma być podparte tyłem.
statyczny <T numer rozszerzenia> BlockLSTMGrad <T>
utwórz ( Zakres zasięgu , Operand <Long> seqLenMax, Operand <T> x, Operand <T> csPrev, Operand <T> hPrev, Operand <T> w, Operand <T> wci, Operand <T> wcf, Operand <T > wco, Argument <T> b, Argument <T> i, Argument <T> cs, Argument <T> f, Argument <T> o, Argument <T> ci, Argument <T> co, Argument <T> h , Argument <T> csGrad, Argument <T> hGrad, Wartość logiczna usePeephole)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację BlockLSTMGrad.
Wyjście <T>
csPoprzedniGrad ()
Gradient cs_prev, który ma być podparty.
Wyjście <T>
hPoprzedniGrad ()
Gradient h_prev, który ma być podparty do tyłu.
Wyjście <T>
wGrad ()
Nachylenie dla w, które ma być podparte tyłem.
Wyjście <T>
wcfGrad ()
Gradient dla wcf, który ma być podparty od tyłu.
Wyjście <T>
wciGrad ()
Nachylenie wci, które ma być podparte tyłem.
Wyjście <T>
wcoGrad ()
Nachylenie dla wco, które ma być podparte tyłem.
Wyjście <T>
xGrad ()
Gradient x, który ma być podparty do tyłu.

Metody dziedziczone

Metody publiczne

publiczne wyjście <T> bGrad ()

Nachylenie dla w, które ma być podparte tyłem.

public static BlockLSTMGrad <T> create ( Zakres zasięgu , Operand <Long> seqLenMax, Operand <T> x, Operand <T> csPrev, Operand <T> hPrev, Operand <T> w, Operand <T> wci, Operand <T > wcf, Argument <T> wco, Argument <T> b, Argument <T> i, Argument <T> cs, Argument <T> f, Argument <T> o, Argument <T> ci, Argument <T> co , Argument <T> h, Argument <T> csGrad, Argument <T> hGrad, Wartość logiczna usePeephole)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację BlockLSTMGrad.

Parametry
zakres aktualny zakres
seqLenMax Maksymalny czas faktycznie używany przez to wejście. Dane wyjściowe są uzupełniane zerami powyżej tej długości.
X Sekwencja wprowadzona do LSTM, kształt (timelen, rozmiar_wsadu, liczba_wejść).
csPoprzedni Wartość początkowego stanu komórki.
hPoprzedni Początkowy wynik komórki (do wykorzystania w judaszu).
w Matryca wag.
wci Macierz wag dla połączenia wizjera bramki wejściowej.
wcf Matryca wagowa dla połączenia wizjera z bramką zapomnij.
wco Macierz wag dla połączenia wizjera bramki wyjściowej.
B Wektor odchylenia.
I Bramka wejściowa w całej sekwencji czasowej.
cs Stan komórki przed tanh w całej sekwencji czasowej.
F Brama zapominania w całej sekwencji czasowej.
o Bramka wyjściowa w całej sekwencji czasowej.
ci Wejście komórki w całej sekwencji czasowej.
współ Komórka po tanh w całej sekwencji czasowej.
H Wyjściowy wektor h w całym ciągu czasowym.
csGrad Obecny gradient cs.
hGrad Gradient wektora h.
użyj wizjera Czy używać ciężarków przez wizjer.
Zwroty
  • nowa instancja BlockLSTMGrad

publiczne wyjście <T> csPrevGrad ()

Gradient cs_prev, który ma być podparty.

publiczne wyjście <T> hPoprzedniGrad ()

Gradient h_prev, który ma być podparty do tyłu.

publiczne wyjście <T> wGrad ()

Nachylenie dla w, które ma być podparte tyłem.

publiczne wyjście <T> wcfGrad ()

Gradient dla wcf, który ma być podparty od tyłu.

publiczne wyjście <T> wciGrad ()

Nachylenie wci, które ma być podparte tyłem.

publiczne wyjście <T> wcoGrad ()

Nachylenie dla wco, które ma być podparte tyłem.

publiczne wyjście <T> xGrad ()

Gradient x, który ma być podparty do tyłu.