CudnnRNNV3

classe finale publique CudnnRNNV3

Un RNN soutenu par cuDNN.

Calcule le RNN à partir des états d'entrée et initiaux, par rapport au tampon de paramètres. Accepte une entrée supplémentaire "sequence_lengths" que CudnnRNN.

rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. Doit être « unidirectionnel » ou « bidirectionnel ». abandon : probabilité d'abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : La 1ère partie d'une graine pour initialiser l'abandon. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. input : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [seq_length, batch_size, input_size]. Si time_major est faux, la forme est [batch_size, seq_length, input_size]. input_h : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [num_layer * dir, batch_size, num_units]. Si time_major est faux, la forme est [batch_size, num_layer * dir, num_units]. input_c : pour LSTM, un tenseur 3D avec la forme de [num_layer * dir, batch, num_units]. Pour les autres modèles, il est ignoré. params : un tenseur 1D qui contient les poids et les biais dans une présentation opaque. La taille doit être créée via CudnnRNNParamsSize et initialisée séparément. Notez qu’ils peuvent ne pas être compatibles entre différentes générations. C'est donc une bonne idée de sauvegarder et de restaurer séquence_lengths : un vecteur de longueurs de chaque séquence d'entrée. sortie : si time_major est vrai, il s'agit d'un tenseur 3D ayant la forme de [seq_length, batch_size, dir * num_units]. Si time_major est faux, la forme est [batch_size, seq_length, dir * num_units]. output_h : la même forme a input_h. output_c : la même forme que input_c pour LSTM. Un tenseur vide pour d'autres modèles. is_training : indique si cette opération est utilisée pour l'inférence ou la formation. time_major : indique si le format d'entrée/sortie est majeur en temps ou majeur en lot. reserve_space : Un tenseur opaque qui peut être utilisé dans le calcul du backprop. Il n'est produit que si is_training est vrai.

Classes imbriquées

classe CudnnRNNV3.Options Attributs facultatifs pour CudnnRNNV3

Méthodes publiques

statique <T étend le nombre> CudnnRNNV3 <T>
créer ( Portée de portée , Entrée d' opérande <T>, Entrée d' opérande <T> H, Entrée d'opérande <T> C, Paramètres d'opérande <T>, Longueurs de séquence d' opérande <Integer>, Options... )
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNV3.
statique CudnnRNNV3.Options
direction (direction de la chaîne)
statique CudnnRNNV3.Options
abandon (abandon flottant)
Sortie <?>
statique CudnnRNNV3.Options
inputMode (chaîne inputMode)
statique CudnnRNNV3.Options
isTraining (isTraining booléen)
statique CudnnRNNV3.Options
numProj (numProj long)
Sortie <T>
sortir ()
Sortie <T>
Sortie <T>
Sortie <T>
statique CudnnRNNV3.Options
rnnMode (Chaîne rnnMode)
statique CudnnRNNV3.Options
graine (graine longue)
statique CudnnRNNV3.Options
graine2 (graine longue2)
statique CudnnRNNV3.Options
timeMajor (Booléen timeMajor)

Méthodes héritées

Méthodes publiques

public static CudnnRNNV3 <T> créer (portée de portée , entrée d'opérande <T>, entrée d'opérande <T> H, entrée d'opérande <T> C, paramètres d'opérande <T>, longueurs de séquence d'opérande <Integer>, options... )

Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNV3.

Paramètres
portée portée actuelle
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de CudnnRNNV3

Direction publique statique CudnnRNNV3.Options (direction de la chaîne)

abandon public statique CudnnRNNV3.Options (abandon flottant)

sortie publique <?> hostReserved ()

public statique CudnnRNNV3.Options inputMode (String inputMode)

public statique CudnnRNNV3.Options isTraining (booléen isTraining)

public statique CudnnRNNV3.Options numProj (Long numProj)

sortie publique <T> sortie ()

sortie publique <T> sortieC ()

sortie publique <T> sortieH ()

sortie publique <T> reserveSpace ()

public statique CudnnRNNV3.Options rnnMode (String rnnMode)

graine publique statique CudnnRNNV3.Options (graine longue)

public statique CudnnRNNV3.Options seed2 (Long seed2)

public statique CudnnRNNV3.Options timeMajor (booléen timeMajor)