כיתת גמר ציבורית ResourceApplyAdam
עדכן את '*var' לפי אלגוריתם Adam.
$$\text{lr}_t := \mathrm{learning_rate} * \sqrt{1 - \beta_2^t} / (1 - \beta_1^t)$$$$m_t := \beta_1 * m_{t-1} + (1 - \beta_1) * g$$$$v_t := \beta_2 * v_{t-1} + (1 - \beta_2) * g * g$$$$\text{variable} := \text{variable} - \text{lr}_t * m_t / (\sqrt{v_t} + \epsilon)$$
כיתות מקוננות
מַחלָקָה | ResourceApplyAdam.Options | תכונות אופציונליות עבור ResourceApplyAdam |
קבועים
חוּט | OP_NAME | השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow |
שיטות ציבוריות
static <T מרחיב את TType > ResourceApplyAdam | |
static ResourceApplyAdam.Options | useLocking (useLocking בוליאני) |
static ResourceApplyAdam.Options | useNesterov (בוליאני useNesterov) |
שיטות בירושה
קבועים
מחרוזת סופית סטטית ציבורית OP_NAME
השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow
ערך קבוע: "ResourceApplyAdam"
שיטות ציבוריות
public static ResourceApplyAdam create ( Scope scope, Operand <?> var, Operand <?> m, Operand <?> v, Operand <T> beta1Power, Operand <T> beta2Power, Operand <T> lr, Operand <T> beta1, Operand <T> beta2, Operand <T> epsilon, Operand <T> grad, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת ResourceApplyAdam חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
var | צריך להיות ממשתנה(). |
מ | צריך להיות ממשתנה(). |
v | צריך להיות ממשתנה(). |
beta1Power | חייב להיות סקלר. |
beta2Power | חייב להיות סקלר. |
lr | גורם קנה מידה. חייב להיות סקלר. |
בטא1 | גורם מומנטום. חייב להיות סקלר. |
בטא2 | גורם מומנטום. חייב להיות סקלר. |
אפסילון | מונח רכס. חייב להיות סקלר. |
גראד | השיפוע. |
אפשרויות | נושא ערכי תכונות אופציונליות |
מחזיר
- מופע חדש של ResourceApplyAdam
Public static ResourceApplyAdam.Options useLocking (שימוש בוליאני)
פרמטרים
השתמש בנעילה | אם 'נכון', עדכון הטנזורים var, m ו-v יהיה מוגן על ידי מנעול; אחרת ההתנהגות אינה מוגדרת, אך עלולה להפגין פחות מחלוקת. |
---|
public static ResourceApplyAdam.Options useNesterov (בוליאני useNesterov)
פרמטרים
השתמש ב-Nesterov | אם 'נכון', משתמש בעדכון Nestrov. |
---|