Calcule la taille des poids qui peuvent être utilisés par un modèle Cudnn RNN.
Renvoie la taille des paramètres qui peuvent être utilisés par le modèle Cudnn RNN. L'allocation de poids et l'initialisation ultérieures doivent utiliser cette taille.
num_layers : spécifie le nombre de couches dans le modèle RNN. num_units : spécifie la taille de l'état caché. input_size : Spécifie la taille de l’état d’entrée. rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. dir = (direction == bidirectionnel) ? 2 : 1 abandon : probabilité d’abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : la 1ère partie d'une graine pour initialiser le dropout. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. params_size : la taille du tampon de paramètres qui doit être alloué et initialisé pour ce modèle RNN. Notez que ce tampon de paramètres peut ne pas être compatible entre les GPU. Veuillez utiliser CudnnRNNParamsWeights et CudnnRNNParamsBiases pour les enregistrer et les restaurer d'une manière compatible entre différentes exécutions.
Classes imbriquées
classe | CudnnRnnParamsSize.Options | Attributs facultatifs pour CudnnRnnParamsSize |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
Sortie <U> | comme Sortie () Renvoie le handle symbolique du tenseur. |
static <U étend TNumber , T étend TNumber > CudnnRnnParamsSize <U> | |
statique CudnnRnnParamsSize.Options | direction (direction de la chaîne) |
statique CudnnRnnParamsSize.Options | abandon (abandon flottant) |
statique CudnnRnnParamsSize.Options | inputMode (chaîne inputMode) |
statique CudnnRnnParamsSize.Options | numProj (numProj long) |
Sortie <U> | |
statique CudnnRnnParamsSize.Options | rnnMode (Chaîne rnnMode) |
statique CudnnRnnParamsSize.Options | graine (graine longue) |
statique CudnnRnnParamsSize.Options | graine2 (graine longue2) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
sortie publique <U> asOutput ()
Renvoie le handle symbolique du tenseur.
Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.
public static CudnnRnnParamsSize <U> créer ( Scope scope, Operand < TInt32 > numLayers, Operand < TInt32 > numUnits, Operand < TInt32 > inputSize, Class<T> T, Class<U> S, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRnnParamsSize.
Paramètres
portée | portée actuelle |
---|---|
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CudnnRnnParamsSize