Passaggio di backprop di CudnnRNNV3.
Calcola il backprop sia dei dati che dei pesi in un RNN. Accetta un input extra "sequence_lengths" rispetto a CudnnRNNBackprop.
rnn_mode: indica il tipo del modello RNN. input_mode: indica se esiste una proiezione lineare tra l'input e il calcolo effettivo prima del primo livello. 'skip_input' è consentito solo quando input_size == num_units; 'auto_select' implica 'skip_input' quando input_size == num_units; altrimenti implica 'linear_input'. direzione: indica se verrà utilizzato un modello bidirezionale. Dovrebbe essere "unidirezionale" o "bidirezionale". dropout: probabilità di abbandono. Quando impostato su 0., il dropout è disabilitato. seed: la prima parte di un seed per inizializzare il dropout. seed2: la seconda parte di un seed per inizializzare il dropout. input: se time_major è vero, questo è un tensore 3D con la forma di [seq_length, batch_size, input_size]. Se time_major è falso, la forma è [batch_size, seq_length, input_size]. input_h: se time_major è vero, questo è un tensore 3-D con la forma di [num_layer * dir, batch_size, num_units]. Se time_major è falso, la forma è [batch_size, num_layer * dir, num_units]. input_c: per LSTM, un tensore 3D con la forma di [num_layer * dir, batch, num_units]. Per gli altri modelli viene ignorato. params: un tensore 1-D che contiene i pesi e i bias in un layout opaco. La dimensione deve essere creata tramite CudnnRNNParamsSize e inizializzata separatamente. Tieni presente che potrebbero non essere compatibili tra generazioni diverse. Quindi è una buona idea salvare e ripristinare sequence_lengths: un vettore di lunghezze di ciascuna sequenza di input. output: Se time_major è vero, questo è un tensore 3-D con la forma di [seq_length, batch_size, dir * num_units]. Se time_major è falso, la forma è [batch_size, seq_length, dir * num_units]. output_h: la stessa forma ha input_h. output_c: la stessa forma di input_c per LSTM. Un tensore vuoto per altri modelli. output_backprop: un tensore 3D con la stessa forma dell'output nel passaggio in avanti. output_h_backprop: un tensore 3-D con la stessa forma di output_h nel passaggio in avanti. output_c_backprop: un tensore 3D con la stessa forma di output_c nel passaggio in avanti. time_major: indica se il formato di input/output è time major o batch major. Reserve_space: lo stesso Reserve_space prodotto nell'operazione di inoltro. input_backprop: il backprop da inserire nel passaggio in avanti. Ha la stessa forma dell'input. input_h_backprop: il backprop di input_h nel passaggio in avanti. Ha la stessa forma di input_h. input_c_backprop: il backprop di input_c nel passaggio in avanti. Ha la stessa forma di input_c. params_backprop: il backprop del buffer params nel passaggio in avanti. Ha la stessa forma di params.
Classi nidificate
classe | CudnnRNNBackprop.Opzioni | Attributi facoltativi per CudnnRNNBackprop |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
statico <T estende TNumber > CudnnRNNBackprop <T> | create ( Ambito ambito , Operando <T> input, Operando <T> inputH, Operando <T> inputC, Operando <T> parametri, Operando < TInt32 > lunghezze sequenza, Operando <T> output, Operando <T> outputH, Operando <T > outputC, Operando <T> outputBackprop, Operando <T> outputHBackprop, Operando <T> outputCBackprop, Operando <T> ReserveSpace, Operando <?> hostReserved, Opzioni... opzioni) Metodo factory per creare una classe che racchiude una nuova operazione CudnnRNNBackprop. |
CudnnRNNBackprop.Options statico | direzione (direzione della stringa) |
CudnnRNNBackprop.Options statico | dropout (dropout flottante) |
Uscita <T> | |
Uscita <T> | |
Uscita <T> | |
CudnnRNNBackprop.Options statico | inputMode (Stringa inputMode) |
CudnnRNNBackprop.Options statico | numProj (numProj lungo) |
Uscita <T> | |
CudnnRNNBackprop.Options statico | rnnMode (Stringa rnnMode) |
CudnnRNNBackprop.Options statico | seme (seme lungo) |
CudnnRNNBackprop.Options statico | seme2 (seme lungo2) |
CudnnRNNBackprop.Options statico | timeMajor (tempo booleano Major) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
public static CudnnRNNBackprop <T> create ( Ambito ambito , Operando <T> input, Operando <T> inputH, Operando <T> inputC, Operando <T> parametri, Operando < TInt32 > lunghezze sequenza, Operando <T> output, Operando <T > outputH, Operando <T> outputC, Operando <T> outputBackprop, Operando <T> outputHBackprop, Operando <T> outputCBackprop, Operando <T> ReserveSpace, Operando <?> hostReserved, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione CudnnRNNBackprop.
Parametri
scopo | ambito attuale |
---|---|
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di CudnnRNNBackprop