Aggiorna '*var' secondo l'algoritmo AdaMax.
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) variabile <- variabile - tasso_apprendimento / (1 - beta1^ t) * m_t / (v_t + epsilon)
Classi nidificate
classe | ApplicaAdaMax.Options | Attributi facoltativi per ApplyAdaMax |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
Uscita <T> | comeuscita () Restituisce l'handle simbolico del tensore. |
statico <T estende TType > ApplyAdaMax <T> | create ( Ambito ambito , Operando <T> var, Operando <T> m, Operando <T> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T> beta2, Operando <T > epsilon, Operando <T> grad, Opzioni... opzioni) Metodo factory per creare una classe che racchiude una nuova operazione ApplyAdaMax. |
Uscita <T> | fuori () Uguale a "var". |
ApplyAdaMax.Options statico | useLocking (useLocking booleano) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
Uscita pubblica <T> asOutput ()
Restituisce l'handle simbolico del tensore.
Gli input per le operazioni TensorFlow sono output di un'altra operazione TensorFlow. Questo metodo viene utilizzato per ottenere un handle simbolico che rappresenta il calcolo dell'input.
public static ApplyAdaMax <T> create ( Ambito ambito , Operando <T> var, Operando <T> m, Operando <T> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T > beta2, Operando <T> epsilon, Operando <T> grad, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione ApplyAdaMax.
Parametri
scopo | ambito attuale |
---|---|
var | Dovrebbe provenire da una variabile(). |
M | Dovrebbe provenire da una variabile(). |
v | Dovrebbe provenire da una variabile(). |
beta1Power | Deve essere uno scalare. |
lr | Fattore di scala. Deve essere uno scalare. |
beta1 | Fattore di slancio. Deve essere uno scalare. |
beta2 | Fattore di slancio. Deve essere uno scalare. |
epsilon | Termine di cresta. Deve essere uno scalare. |
grado | Il gradiente. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di ApplyAdaMax
public static ApplyAdaMax.Options useLocking (useLocking booleano)
Parametri
utilizzareBlocco | Se "True", l'aggiornamento dei tensori var, m e v sarà protetto da un blocco; altrimenti il comportamento non è definito, ma può mostrare meno contesa. |
---|