طبق طرح حرکت، ورودیهای مربوطه را در «*var» و «*accum» بهروزرسانی کنید.
تنظیم use_nesterov = درست است اگر می خواهید از حرکت Nesterov استفاده کنید.
یعنی برای ردیف هایی که grad داریم، var و accum را به صورت زیر به روز می کنیم:
$$accum = accum * momentum + grad$$$$var -= lr * accum$$
کلاس های تو در تو
کلاس | SparseApplyMomentum.Options | ویژگی های اختیاری برای SparseApplyMomentum |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
خروجی <T> | asOutput () دسته نمادین تانسور را برمیگرداند. |
static <T TType > SparseApplyMomentum <T> را گسترش می دهد | |
خروجی <T> | بیرون () همان "var". |
استاتیک SparseApplyMomentum.Options | useLocking (قفل کردن استفاده بولی) |
استاتیک SparseApplyMomentum.Options | useNesterov (استفاده بولی Nesterov) |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
خروجی عمومی <T> asOutput ()
دسته نمادین تانسور را برمیگرداند.
ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.
عمومی استاتیک SparseApplyMomentum <T> ایجاد ( دامنه دامنه ، عملوند <T> var، عملوند <T> accum، عملوند <T> lr، عملوند <T> grad، عملوند <? گسترش TNumber > شاخصها، عملوند <T> تکانه، گزینهها ... گزینه ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات جدید SparseApplyMomentum را بسته بندی می کند.
پارامترها
دامنه | محدوده فعلی |
---|---|
var | باید از یک متغیر () باشد. |
تجمع | باید از یک متغیر () باشد. |
lr | میزان یادگیری باید اسکالر باشد. |
درجه | گرادیان. |
شاخص ها | بردار شاخص ها در بعد اول var و accum. |
حرکت | تکانه. باید اسکالر باشد. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از SparseApplyMomentum
عمومی استاتیک SparseApplyMomentum.Options useLocking (useLocking بولی)
پارامترها
استفاده از قفل کردن | اگر «درست» باشد، بهروزرسانی تانسور var و accum توسط یک قفل محافظت میشود. در غیر این صورت رفتار تعریف نشده است، اما ممکن است اختلاف کمتری از خود نشان دهد. |
---|
عمومی استاتیک SparseApplyMomentum.Options useNesterov (مصرف بولی Nesterov)
پارامترها
استفاده از نستروف | اگر «درست» باشد، تانسور ارسال شده به درجه محاسبه، var - lr * تکانه * accum خواهد بود، بنابراین در پایان، var که دریافت میکنید در واقع var - lr * تکانه * accum است. |
---|