Обновите «*var» в соответствии с центрированным алгоритмом RMSProp.
Алгоритм центрированного RMSProp использует оценку центрированного второго момента (т. е. дисперсии) для нормализации, в отличие от обычного алгоритма RMSProp, который использует (нецентрированный) второй момент. Это часто помогает при обучении, но требует немного больше затрат с точки зрения вычислений и памяти.
Обратите внимание, что в плотной реализации этого алгоритма mg, ms и Mom будут обновляться, даже если градиент равен нулю, но в этой разреженной реализации mg, ms и Mom не будут обновляться на итерациях, во время которых градиент равен нулю.
средний_квадрат = затухание * средний_квадрат + (1-затух) * градиент ** 2 средний_град = затухание * средний_град + (1-затух) * градиент
Дельта = скорость обучения * градиент / sqrt (средний_квадрат + эпсилон - средний_град ** 2)
mg <- rho * mg_{t-1} + (1-rho) * grad ms <- rho * ms_{t-1} + (1-rho) * grad * grad Mom <- импульс * Mom_{t-1 } + lr * grad / sqrt(ms - mg * mg + epsilon) var <- var - Mom
Вложенные классы
сорт | ApplyCenteredRmsProp.Options | Дополнительные атрибуты для ApplyCenteredRmsProp |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
Выход <Т> | какВывод () Возвращает символический дескриптор тензора. |
статический <T расширяет TType > ApplyCenteredRmsProp <T> | |
Выход <Т> | вне () То же, что «вар». |
статический ApplyCenteredRmsProp.Options | useLocking (логическое значение useLocking) |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
публичный вывод <T> asOutput ()
Возвращает символический дескриптор тензора.
Входные данные для операций TensorFlow являются выходными данными другой операции TensorFlow. Этот метод используется для получения символического дескриптора, который представляет собой вычисление входных данных.
public static ApplyCenteredRmsProp <T> create ( Область действия, Операнд <T> var, Операнд <T> mg, Операнд <T> мс, Операнд <T> Mom, Операнд <T> lr, Операнд <T> rho, Операнд <T > импульс, Операнд <T> эпсилон, Операнд <T> град, Опции... опции)
Фабричный метод для создания класса, обертывающего новую операцию ApplyCenteredRmsProp.
Параметры
объем | текущий объем |
---|---|
вар | Должно быть из переменной(). |
мг | Должно быть из переменной(). |
РС | Должно быть из переменной(). |
мама | Должно быть из переменной(). |
лр | Коэффициент масштабирования. Должно быть скаляр. |
ро | Скорость распада. Должно быть скаляр. |
импульс | Шкала импульса. Должно быть скаляр. |
эпсилон | Риджовый термин. Должно быть скаляр. |
выпускник | Градиент. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр ApplyCenteredRmsProp
public static ApplyCenteredRmsProp.Options useLocking (логическое значение useLocking)
Параметры
использоватьLocking | Если задано значение True, обновление тензоров var, mg, ms и Mom защищено блокировкой; в противном случае поведение не определено, но может вызывать меньше конфликтов. |
---|