Mettez à jour '*var' selon l'algorithme AdaMax.
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) variable <- variable - learning_rate / (1 - beta1^ t) * m_t / (v_t + epsilon)
Classes imbriquées
classe | AppliquerAdaMax.Options | Attributs facultatifs pour ApplyAdaMax |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
Sortie <T> | comme Sortie () Renvoie le handle symbolique du tenseur. |
statique <T étend TType > ApplyAdaMax <T> | créer ( Scope scope, Opérande <T> var, Opérande <T> m, Opérande <T> v, Opérande <T> beta1Power, Opérande <T> lr, Opérande <T> beta1, Opérande <T> beta2, Opérande <T > epsilon, Opérande <T> grad, Options... options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération ApplyAdaMax. |
Sortie <T> | dehors () Identique à "var". |
statique ApplyAdaMax.Options | useLocking (booléen useLocking) |
Méthodes héritées
booléen | est égal à (Objet arg0) |
Classe finale<?> | obtenirClasse () |
int | Code de hachage () |
vide final | notifier () |
vide final | notifierTous () |
Chaîne | àChaîne () |
vide final | attendre (long arg0, int arg1) |
vide final | attendez (long arg0) |
vide final | attendez () |
résuméExécutionEnvironnement | env () Renvoie l'environnement d'exécution dans lequel cette opération a été créée. |
opération abstraite |
sortie abstraite <T> | comme Sortie () Renvoie le handle symbolique du tenseur. |
résumé T | asTensor () Renvoie le tenseur à cet opérande. |
Forme abstraite | |
Classe abstraite<T> | taper () Renvoie le type de tenseur de cet opérande |
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
sortie publique <T> asOutput ()
Renvoie le handle symbolique du tenseur.
Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.
public static ApplyAdaMax <T> create ( Scope scope, Operand <T> var, Operand <T> m, Operand <T> v, Operand <T> beta1Power, Operand <T> lr, Operand <T> beta1, Operand <T > beta2, Opérande <T> epsilon, Opérande <T> grad, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération ApplyAdaMax.
Paramètres
portée | portée actuelle |
---|---|
var | Doit provenir d'une variable (). |
m | Doit provenir d'une variable (). |
v | Doit provenir d'une variable (). |
bêta1Puissance | Ça doit être un scalaire. |
g / D | Facteur d'échelle. Ça doit être un scalaire. |
bêta1 | Facteur d'élan. Ça doit être un scalaire. |
bêta2 | Facteur d'élan. Ça doit être un scalaire. |
épsilon | Terme de crête. Ça doit être un scalaire. |
diplômé | Le dégradé. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de ApplyAdaMax
public statique ApplyAdaMax.Options useLocking (booléen useLocking)
Paramètres
utiliserVerrouillage | Si `True`, la mise à jour des tenseurs var, m et v sera protégée par un verrou ; sinon, le comportement n'est pas défini, mais peut présenter moins de conflits. |
---|