flujo tensor:: operaciones:: SparseApplyProximalAdagrad
#include <training_ops.h>
Entradas de actualización escasas en '*var' y '*accum' según el algoritmo FOBOS.
Resumen
Es decir, para las filas para las que tenemos grad, actualizamos var y accum de la siguiente manera:
$$accum += grad * grad$$
$$prox_v = var$$
$$prox_v -= lr * grad * (1 / sqrt(accum))$$
$$var = sign(prox_v)/(1+lr*l2) * max{|prox_v|-lr*l1,0}$$
Argumentos:
- alcance: un objeto de alcance
- var: Debe ser de una Variable().
- accum: Debe ser de una Variable().
- lr: tasa de aprendizaje. Debe ser un escalar.
- l1: regularización L1. Debe ser un escalar.
- l2: regularización L2. Debe ser un escalar.
- grad: El gradiente.
- índices: Un vector de índices en la primera dimensión de var y accum.
Atributos opcionales (ver Attrs
):
- use_locking: si es Verdadero, la actualización de los tensores var y accum estará protegida por un bloqueo; de lo contrario, el comportamiento no está definido, pero puede presentar menos contención.
Devoluciones:
-
Output
: Igual que "var".
Constructores y destructores | |
---|---|
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices) | |
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs) |
Atributos públicos | |
---|---|
operation | |
out |
Funciones públicas | |
---|---|
node () const | ::tensorflow::Node * |
operator::tensorflow::Input () const | |
operator::tensorflow::Output () const |
Funciones estáticas públicas | |
---|---|
UseLocking (bool x) |
estructuras | |
---|---|
tensorflow:: operaciones:: SparseApplyProximalAdagrad:: Atributos | Configuradores de atributos opcionales para SparseApplyProximalAdagrad . |
Atributos públicos
operación
Operation operation
afuera
::tensorflow::Output out
Funciones públicas
SparseApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices )
SparseApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs )
nodo
::tensorflow::Node * node() const
operador::tensorflow::Entrada
operator::tensorflow::Input() const
operador::tensorflow::Salida
operator::tensorflow::Output() const
Funciones estáticas públicas
UsoBloqueo
Attrs UseLocking( bool x )