Convierte parámetros CudnnRNN de forma canónica a forma utilizable. Soporta la proyección en LSTM.
Escribe un conjunto de pesos en el búfer de parámetros opacos para que puedan usarse en próximas capacitaciones o inferencias.
Tenga en cuenta que el búfer de parámetros puede no ser compatible con diferentes GPU. Por lo tanto, cualquier guardado y restauración debe convertirse hacia y desde los pesos y sesgos canónicos.
num_layers: especifica el número de capas en el modelo RNN. num_units: especifica el tamaño del estado oculto. input_size: especifica el tamaño del estado de entrada. pesos: la forma canónica de pesos que se puede utilizar para guardar y restaurar. Es más probable que sean compatibles entre diferentes generaciones. sesgos: la forma canónica de sesgos que se puede utilizar para el ahorro y la restauración. Es más probable que sean compatibles entre diferentes generaciones. num_params_weights: número de matriz de parámetros de peso para todas las capas. num_params_biases: número de vectores de parámetros de sesgo para todas las capas. rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo está permitido cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'entrada_lineal'. direction: Indica si se utilizará un modelo bidireccional. dir = (dirección == bidireccional) ? 2 : 1 abandono: probabilidad de abandono. Cuando se establece en 0, el abandono está deshabilitado. semilla: la primera parte de una semilla para inicializar el abandono. seed2: la segunda parte de una semilla para inicializar el abandono. num_proj: La dimensionalidad de salida para las matrices de proyección. Si es Ninguno o 0, no se realiza ninguna proyección.
Clases anidadas
clase | CudnnRNNCanonicalToParamsV2.Opciones | Atributos opcionales para CudnnRNNCanonicalToParamsV2 |
Métodos públicos
Salida <T> | como salida () Devuelve el identificador simbólico de un tensor. |
estático <T extiende Número> CudnnRNNCanonicalToParamsV2 <T> | |
estático CudnnRNNCanonicalToParamsV2.Options | dirección (dirección de la cadena) |
estático CudnnRNNCanonicalToParamsV2.Options | abandono (abandono flotante) |
estático CudnnRNNCanonicalToParamsV2.Options | modo de entrada (Cadena modo de entrada) |
estático CudnnRNNCanonicalToParamsV2.Options | numProj (NúmProy largo) |
Salida <T> | parámetros () |
estático CudnnRNNCanonicalToParamsV2.Options | rnnMode (Cadena rnnMode) |
estático CudnnRNNCanonicalToParamsV2.Options | semilla (semilla larga) |
estático CudnnRNNCanonicalToParamsV2.Options | semilla2 (semilla larga2) |
Métodos Heredados
Métodos públicos
salida pública <T> como salida ()
Devuelve el identificador simbólico de un tensor.
Las entradas de las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
public static CudnnRNNCanonicalToParamsV2 <T> create ( Scope scope, Operand <Integer> numLayers, Operand <Integer> numUnits, Operand <Integer> inputSize, Iterable< Operand <T>> pesos, Iterable< Operand <T>> biases, Options.. . opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNCanonicalToParamsV2.
Parámetros
alcance | alcance actual |
---|---|
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CudnnRNNCanonicalToParamsV2