Actualice '* var' de acuerdo con el algoritmo AdaMax.
m_t <- beta1 * m_ {t-1} + (1 - beta1) * g v_t <- max (beta2 * v_ {t-1}, abs (g)) variable <- variable - tasa_de_aprendizaje / (1 - beta1 ^ t) * m_t / (v_t + épsilon)
Clases anidadas
clase | ApplyAdaMax.Options | Los atributos opcionales para ApplyAdaMax |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
Salida <T> | asOutput () Devuelve el identificador simbólico del tensor. |
estática <T se extiende Ttype > ApplyAdaMax <T> | crear ( Alcance alcance, operando <T> var, operando <T> m, operando <T> v, operando <T> beta1Power, operando <T> lr, operando <T> beta1, operando <T> beta2, operando <T > épsilon, operando <T> graduado, opciones ... opciones) Método de fábrica para crear una clase que envuelva una nueva operación ApplyAdaMax. |
Salida <T> | fuera () Igual que "var". |
estáticas ApplyAdaMax.Options | useLocking (Boolean useLocking) |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
pública de salida <T> asOutput ()
Devuelve el identificador simbólico del tensor.
Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
public static ApplyAdaMax <T> crear ( Alcance alcance, operando <T> var, operando <T> m, operando <T> v, operando <T> beta1Power, operando <T> lr, operando <T> beta1, operando <T > beta2, operando <T> épsilon, operando <T> graduado, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación ApplyAdaMax.
Parámetros
alcance | alcance actual |
---|---|
var | Debe ser de una variable (). |
metro | Debe ser de una variable (). |
v | Debe ser de una variable (). |
beta1Power | Debe ser un escalar. |
lr | Factor de escala. Debe ser un escalar. |
beta1 | Factor de momento. Debe ser un escalar. |
beta2 | Factor de momento. Debe ser un escalar. |
épsilon | Término de cresta. Debe ser un escalar. |
graduado | El gradiente. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de ApplyAdaMax
public static ApplyAdaMax.Options useLocking (booleano useLocking)
Parámetros
useLocking | Si es "True", la actualización de los tensores var, myv estará protegida por un bloqueo; de lo contrario, el comportamiento no está definido, pero puede presentar menos contención. |
---|