Convertit les paramètres CudnnRNN de la forme canonique en forme utilisable. Il prend en charge la projection dans LSTM.
Écrit un ensemble de poids dans le tampon de paramètres opaque afin qu'ils puissent être utilisés dans les formations ou inférences à venir.
Notez que le tampon de paramètres peut ne pas être compatible entre différents GPU. Ainsi, toute sauvegarde et restauration doit être convertie vers et depuis les poids et biais canoniques.
num_layers : spécifie le nombre de couches dans le modèle RNN. num_units : spécifie la taille de l'état caché. input_size : Spécifie la taille de l’état d’entrée. poids : la forme canonique des poids qui peuvent être utilisés pour la sauvegarde et la restauration. Ils sont plus susceptibles d’être compatibles entre les différentes générations. biais : la forme canonique des biais qui peuvent être utilisés pour la sauvegarde et la restauration. Ils sont plus susceptibles d’être compatibles entre les différentes générations. num_params_weights : nombre de matrices de paramètres de poids pour toutes les couches. num_params_biases : nombre de vecteurs de paramètres de biais pour toutes les couches. rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. dir = (direction == bidirectionnel) ? 2 : 1 abandon : probabilité d’abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : la 1ère partie d'une graine pour initialiser le dropout. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. num_proj : la dimensionnalité de sortie pour les matrices de projection. Si Aucun ou 0, aucune projection n’est effectuée.
Classes imbriquées
classe | CudnnRNNCanonicalToParams.Options | Attributs facultatifs pour CudnnRNNCanonicalToParams |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
Sortie <T> | comme Sortie () Renvoie le handle symbolique du tenseur. |
statique <T étend TNumber > CudnnRNNCanonicalToParams <T> | |
statique CudnnRNNCanonicalToParams.Options | direction (direction de la chaîne) |
statique CudnnRNNCanonicalToParams.Options | abandon (abandon flottant) |
statique CudnnRNNCanonicalToParams.Options | inputMode (chaîne inputMode) |
statique CudnnRNNCanonicalToParams.Options | numProj (numProj long) |
Sortie <T> | paramètres () |
statique CudnnRNNCanonicalToParams.Options | rnnMode (Chaîne rnnMode) |
statique CudnnRNNCanonicalToParams.Options | graine (graine longue) |
statique CudnnRNNCanonicalToParams.Options | graine2 (graine longue2) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
sortie publique <T> asOutput ()
Renvoie le handle symbolique du tenseur.
Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.
public static CudnnRNNCanonicalToParams <T> créer ( Portée de portée , Opérande < TInt32 > numLayers, Opérande < TInt32 > numUnits, Opérande < TInt32 > inputSize, Iterable< Operand <T>> poids, Iterable< Operand <T>> biais, Options. .options )
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNCanonicalToParams.
Paramètres
portée | portée actuelle |
---|---|
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CudnnRNNCanonicalToParams