כיתת גמר ציבורית ResourceApplyAdam
עדכן את '*var' לפי אלגוריתם Adam.
$$\text{lr}_t := \mathrm{learning_rate} * \sqrt{1 - \beta_2^t} / (1 - \beta_1^t)$$$$m_t := \beta_1 * m_{t-1} + (1 - \beta_1) * g$$$$v_t := \beta_2 * v_{t-1} + (1 - \beta_2) * g * g$$$$\text{variable} := \text{variable} - \text{lr}_t * m_t / (\sqrt{v_t} + \epsilon)$$
כיתות מקוננות
| מַחלָקָה | ResourceApplyAdam.Options | תכונות אופציונליות עבור ResourceApplyAdam | |
קבועים
| חוּט | OP_NAME | השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow |
שיטות ציבוריות
| static <T מרחיב את TType > ResourceApplyAdam | |
| static ResourceApplyAdam.Options | useLocking (useLocking בוליאני) |
| static ResourceApplyAdam.Options | useNesterov (בוליאני useNesterov) |
שיטות בירושה
קבועים
מחרוזת סופית סטטית ציבורית OP_NAME
השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow
ערך קבוע: "ResourceApplyAdam"
שיטות ציבוריות
public static ResourceApplyAdam create ( Scope scope, Operand <?> var, Operand <?> m, Operand <?> v, Operand <T> beta1Power, Operand <T> beta2Power, Operand <T> lr, Operand <T> beta1, Operand <T> beta2, Operand <T> epsilon, Operand <T> grad, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת ResourceApplyAdam חדשה.
פרמטרים
| תְחוּם | ההיקף הנוכחי |
|---|---|
| var | צריך להיות ממשתנה(). |
| מ | צריך להיות ממשתנה(). |
| v | צריך להיות ממשתנה(). |
| beta1Power | חייב להיות סקלר. |
| beta2Power | חייב להיות סקלר. |
| lr | גורם קנה מידה. חייב להיות סקלר. |
| בטא1 | גורם מומנטום. חייב להיות סקלר. |
| בטא2 | גורם מומנטום. חייב להיות סקלר. |
| אפסילון | מונח רכס. חייב להיות סקלר. |
| גראד | השיפוע. |
| אפשרויות | נושא ערכי תכונות אופציונליות |
מחזיר
- מופע חדש של ResourceApplyAdam
Public static ResourceApplyAdam.Options useLocking (שימוש בוליאני)
פרמטרים
| השתמש בנעילה | אם 'נכון', עדכון הטנזורים var, m ו-v יהיה מוגן על ידי מנעול; אחרת ההתנהגות אינה מוגדרת, אך עלולה להפגין פחות מחלוקת. |
|---|
public static ResourceApplyAdam.Options useNesterov (בוליאני useNesterov)
פרמטרים
| השתמש ב-Nesterov | אם 'נכון', משתמש בעדכון Nestrov. |
|---|