Actualice '* var' y '* acumula' de acuerdo con FOBOS con la tasa de aprendizaje de Adagrad.
acum + = grad graduado prox_v = var - LR graduado (1 / sqrt (Acum)) var = signo (prox_v) / (1 + lr L2) max {| prox_v | -lr l1,0}
Clases anidadas
clase | ResourceApplyProximalAdagrad.Options | Los atributos opcionales para ResourceApplyProximalAdagrad |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
estática <T se extiende Ttype > ResourceApplyProximalAdagrad | |
estáticas ResourceApplyProximalAdagrad.Options | useLocking (Boolean useLocking) |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
public static ResourceApplyProximalAdagrad crear ( Alcance alcance, operando <?> var, operando <?> acum, operando <T> lr, operando <T> L1, operando <T> L2, operando <T> graduado, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación ResourceApplyProximalAdagrad.
Parámetros
alcance | alcance actual |
---|---|
var | Debe ser de una variable (). |
acumular | Debe ser de una variable (). |
lr | Factor de escala. Debe ser un escalar. |
l1 | Regularización L1. Debe ser un escalar. |
l2 | Regularización L2. Debe ser un escalar. |
graduado | El gradiente. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de ResourceApplyProximalAdagrad
estáticas pública ResourceApplyProximalAdagrad.Options useLocking (booleano useLocking)
Parámetros
useLocking | Si es Verdadero, la actualización de los tensores var y acumuladores estará protegida por un candado; de lo contrario, el comportamiento no está definido, pero puede presentar menos contención. |
---|