एडम एल्गोरिथम के अनुसार '*var' को अपडेट करें।
$$\text{lr}_t := \mathrm{learning_rate} * \sqrt{1 - \beta_2^t} / (1 - \beta_1^t)$$$$m_t := \beta_1 * m_{t-1} + (1 - \beta_1) * g$$$$v_t := \beta_2 * v_{t-1} + (1 - \beta_2) * g * g$$$$\hat{v}_t := max{\hat{v}_{t-1}, v_t}$$$$\text{variable} := \text{variable} - \text{lr}_t * m_t / (\sqrt{\hat{v}_t} + \epsilon)$$
नेस्टेड क्लासेस
कक्षा | रिसोर्सएप्लाईएडमविथएम्सग्रेड.विकल्प | ResourceApplyAdamWithAmsgrad के लिए वैकल्पिक विशेषताएँ |
सार्वजनिक तरीके
स्टेटिक <T> रिसोर्सएप्लाईएडमविथएम्सग्रेड | बनाएं ( स्कोप स्कोप, ऑपरेंड <?> वर, ऑपरेंड <?> एम, ऑपरेंड <?> वी, ऑपरेंड <?> व्हाट, ऑपरेंड <टी> बीटा1पावर, ऑपरेंड <टी> बीटा2पावर, ऑपरेंड <टी> एलआर, ऑपरेंड <टी > बीटा1, ऑपरेंड <टी> बीटा2, ऑपरेंड <टी> एप्सिलॉन, ऑपरेंड <टी> ग्रेड, विकल्प... विकल्प) एक नए रिसोर्सएप्लाईएडमविथएम्सग्रेड ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि। |
स्टेटिक रिसोर्सएप्लाईएडमविथएम्सग्रेड.ऑप्शंस | यूज़लॉकिंग (बूलियन यूज़लॉकिंग) |
विरासत में मिली विधियाँ
सार्वजनिक तरीके
सार्वजनिक स्थैतिक संसाधनApplyAdamWithAmsgrad बनाएं ( स्कोप स्कोप, ऑपरेंड <?> var, ऑपरेंड <?> m, ऑपरेंड <?> v, ऑपरेंड <?> vhat, ऑपरेंड <T> beta1Power, ऑपरेंड <T> beta2Power, ऑपरेंड <T> lr, ऑपरेंड <टी> बीटा1, ऑपरेंड <टी> बीटा2, ऑपरेंड <टी> एप्सिलॉन, ऑपरेंड <टी> ग्रेड, विकल्प... विकल्प)
एक नए रिसोर्सएप्लाईएडमविथएम्सग्रेड ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
पैरामीटर
दायरा | वर्तमान दायरा |
---|---|
वर | एक वेरिएबल() से होना चाहिए। |
एम | एक वेरिएबल() से होना चाहिए। |
वी | एक वेरिएबल() से होना चाहिए। |
क्या | एक वेरिएबल() से होना चाहिए। |
बीटा1पावर | एक अदिश राशि होनी चाहिए. |
बीटा2पावर | एक अदिश राशि होनी चाहिए. |
एलआर | मापन कारक। एक अदिश राशि होनी चाहिए. |
बीटा1 | संवेग कारक. एक अदिश राशि होनी चाहिए. |
बीटा2 | संवेग कारक. एक अदिश राशि होनी चाहिए. |
एप्सिलॉन | रिज शब्द. एक अदिश राशि होनी चाहिए. |
ग्रैड | ढाल. |
विकल्प | वैकल्पिक गुण मान रखता है |
रिटर्न
- resourceApplyAdamWithAmsgrad का एक नया उदाहरण
सार्वजनिक स्थैतिक संसाधन ApplyAdamWithAmsgrad.Options उपयोगलॉकिंग (बूलियन उपयोगलॉकिंग)
पैरामीटर
लॉकिंग का उपयोग करें | यदि `सही` है, तो var, m, और v टेंसर का अद्यतन एक लॉक द्वारा संरक्षित किया जाएगा; अन्यथा व्यवहार अपरिभाषित है, लेकिन कम विवाद प्रदर्शित कर सकता है। |
---|