publiczna klasa końcowa ResourceApplyAdaMax
Zaktualizuj „*var” zgodnie z algorytmem AdaMax.
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) zmienna <- zmienna - współczynnik_uczenia się / (1 - beta1^ t) * m_t / (v_t + epsilon)
Klasy zagnieżdżone
| klasa | Opcje ResourceApplyAdaMax | Opcjonalne atrybuty dla ResourceApplyAdaMax | |
Stałe
| Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
| statyczny <T rozszerza TType > ResourceApplyAdaMax | |
| statyczne ResourceApplyAdaMax.Options | useLocking (boolowski useLocking) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Wartość stała: „ResourceApplyAdaMax”
Metody publiczne
public static ResourceApplyAdaMax create ( Zakres zakresu, Operand <?> var, Operand <?> m, Operand <?> v, Operand <T> beta1Power, Operand <T> lr, Operand <T> beta1, Operand <T> beta2, Operand <T> epsilon, Operand <T> grad, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację ResourceApplyAdaMax.
Parametry
| zakres | aktualny zakres |
|---|---|
| odm | Powinno pochodzić ze zmiennej (). |
| M | Powinno pochodzić ze zmiennej (). |
| w | Powinno pochodzić ze zmiennej (). |
| beta1Moc | Musi być skalarem. |
| lr | Współczynnik skalowania. Musi być skalarem. |
| beta1 | Czynnik pędu. Musi być skalarem. |
| beta2 | Czynnik pędu. Musi być skalarem. |
| epsilon | Termin grzbietowy. Musi być skalarem. |
| absolwent | Gradient. |
| opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja ResourceApplyAdaMax
publiczny statyczny ResourceApplyAdaMax.Options useLocking (boolean useLocking)
Parametry
| użyjBlokowanie | Jeśli `True`, aktualizacja tensorów var, m i v będzie chroniona blokadą; w przeciwnym razie zachowanie jest niezdefiniowane, ale może wykazywać mniejszą rywalizację. |
|---|