ResourceApplyAdaMax

public final class ResourceApplyAdaMax

Atualize '* var' de acordo com o algoritmo AdaMax.

m_t <- beta1 * m_ {t-1} + (1 - beta1) * g v_t <- max (beta2 * v_ {t-1}, abs (g)) variável <- variável - learning_rate / (1 - beta1 ^ t) * m_t / (v_t + epsilon)

Classes aninhadas

classe ResourceApplyAdaMax.Options Atributos opcionais para ResourceApplyAdaMax

Constantes

Fragmento OP_NAME O nome desta operação, conforme conhecido pelo motor principal TensorFlow

Métodos Públicos

estática <T estende TType > ResourceApplyAdaMax
criar ( Scope escopo, Operando <?> var, Operando <?> m, Operando <?> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T> beta2, Operando <T > epsilon, Operando <T> grad, Options ... opções)
Método de fábrica para criar uma classe que envolve uma nova operação ResourceApplyAdaMax.
estáticos ResourceApplyAdaMax.Options
useLocking (booleano useLocking)

Métodos herdados

Constantes

nome_op final String public static

O nome desta operação, conforme conhecido pelo motor principal TensorFlow

Valor constante: "ResourceApplyAdaMax"

Métodos Públicos

public static ResourceApplyAdaMax criar ( Scope escopo, Operando <?> var, Operando <?> m, Operando <?> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T> beta2, operando <T> epsilon, operando <T> grad, Options ... opções)

Método de fábrica para criar uma classe que envolve uma nova operação ResourceApplyAdaMax.

Parâmetros
alcance escopo atual
var Deve ser de uma variável ().
m Deve ser de uma variável ().
v Deve ser de uma variável ().
beta1Power Deve ser um escalar.
lr Fator de escala. Deve ser um escalar.
beta1 Fator de momentum. Deve ser um escalar.
beta2 Fator de momentum. Deve ser um escalar.
épsilon Termo de cume. Deve ser um escalar.
grad O gradiente.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de ResourceApplyAdaMax

public static ResourceApplyAdaMax.Options useLocking (Boolean useLocking)

Parâmetros
useLocking Se for `True`, a atualização dos tensores var, m e v será protegida por um bloqueio; caso contrário, o comportamento é indefinido, mas pode exibir menos contenção.