Calcula el tamaño de los pesos que puede utilizar un modelo Cudnn RNN.
Devuelve el tamaño de los parámetros que puede utilizar el modelo Cudnn RNN. La asignación de peso y la inicialización posteriores deben utilizar este tamaño.
num_layers: especifica el número de capas en el modelo RNN. num_units: especifica el tamaño del estado oculto. input_size: especifica el tamaño del estado de entrada. rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'entrada_lineal'. dirección: Indica si se utilizará un modelo bidireccional. dir = (dirección == bidireccional)? Abandono 2:1: probabilidad de abandono. Cuando se establece en 0, el abandono está deshabilitado. semilla: la primera parte de una semilla para inicializar el abandono. semilla2: la segunda parte de una semilla para inicializar el abandono. params_size: el tamaño del búfer de parámetros que debe asignarse e inicializarse para este modelo RNN. Tenga en cuenta que este búfer de parámetros puede no ser compatible entre GPU. Utilice CudnnRNNParamsWeights y CudnnRNNParamsBiases para guardarlos y restaurarlos de una manera que sea compatible en diferentes ejecuciones.
Clases anidadas
clase | CudnnRnnParamsSize.Options | Atributos opcionales para CudnnRnnParamsSize |
Constantes
Cadena | OP_NOMBRE | El nombre de esta operación, como lo conoce el motor central de TensorFlow. |
Métodos públicos
Salida <U> | como salida () Devuelve el identificador simbólico del tensor. |
estático <U extiende TNumber , T extiende TNumber > CudnnRnnParamsSize <U> | |
estático CudnnRnnParamsSize.Options | dirección (dirección de la cuerda) |
estático CudnnRnnParamsSize.Options | abandono (abandono flotante) |
estático CudnnRnnParamsSize.Options | modo de entrada (modo de entrada de cadena) |
estático CudnnRnnParamsSize.Options | numProj (NúmProj largo) |
Salida <U> | |
estático CudnnRnnParamsSize.Options | rnnMode (cadena rnnMode) |
estático CudnnRnnParamsSize.Options | semilla (semilla larga) |
estático CudnnRnnParamsSize.Options | semilla2 (semilla larga2) |
Métodos heredados
Constantes
Cadena final estática pública OP_NAME
El nombre de esta operación, como lo conoce el motor central de TensorFlow.
Métodos públicos
Salida pública <U> como Salida ()
Devuelve el identificador simbólico del tensor.
Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
public static CudnnRnnParamsSize <U> create (Ámbito de alcance , Operando < TInt32 > numLayers, Operando < TInt32 > numUnits, Operando < TInt32 > inputSize, Class<T> T, Class<U> S, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CudnnRnnParamsSize.
Parámetros
alcance | alcance actual |
---|---|
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CudnnRnnParamsSize