public class RAdam<Model: Differentiable>: Optimizer
where
Model.TangentVector: VectorProtocol & PointwiseMultiplicative & ElementaryFunctions
& KeyPathIterable,
Model.TangentVector.VectorSpaceScalar == Float
Optimizador RAdam.
Adam rectificado, una variante de Adam que introduce un término para rectificar la variación de la tasa de aprendizaje adaptativo.
Referencia: "Sobre la variación de la tasa de aprendizaje adaptativo y más allá"
Declaración
public typealias Model = Model
La tasa de aprendizaje.
Declaración
public var learningRate: Float
Un coeficiente utilizado para calcular el primer y segundo momento de las pendientes.
Declaración
public var beta1: Float
Coeficiente utilizado para calcular el primer y segundo momento de las pendientes.
Declaración
public var beta2: Float
Un pequeño escalar agregado al denominador para mejorar la estabilidad numérica.
Declaración
public var epsilon: Float
La tasa de aprendizaje decae.
Declaración
public var decay: Float
El paso actual.
Declaración
public var step: Int
Los primeros momentos de las pesas.
Declaración
public var firstMoments: Model.TangentVector
Los segundos momentos de las pesas.
Declaración
public var secondMoments: Model.TangentVector
Declaración
public init( for model: __shared Model, learningRate: Float = 1e-3, beta1: Float = 0.9, beta2: Float = 0.999, epsilon: Float = 1e-8, decay: Float = 0 )
Declaración
public required init(copying other: RAdam, to device: Device)