Sebuah RNN didukung oleh cuDNN.
Menghitung RNN dari input dan status awal, sehubungan dengan buffer params. Menerima satu input tambahan "sequence_lengths" dari CudnnRNN.
rnn_mode: Menunjukkan tipe model RNN. input_mode: Menunjukkan apakah ada proyeksi linier antara input dan perhitungan sebenarnya sebelum lapisan pertama. 'skip_input' hanya diperbolehkan jika input_size == num_units; 'auto_select' menyiratkan 'skip_input' ketika input_size == num_units; jika tidak, ini menyiratkan 'linear_input'. arah: Menunjukkan apakah model dua arah akan digunakan. Harus "searah" atau "dua arah". putus sekolah: probabilitas putus sekolah. Jika disetel ke 0, dropout dinonaktifkan. seed: Bagian pertama dari seed untuk menginisialisasi putus sekolah. seed2: Bagian ke-2 dari seed untuk menginisialisasi putus sekolah. input: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [seq_length, batch_size, input_size]. Jika time_major salah, bentuknya adalah [batch_size, seq_length, input_size]. input_h: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [num_layer * dir, batch_size, num_units]. Jika time_major salah, bentuknya adalah [batch_size, num_layer * dir, num_units]. input_c: Untuk LSTM, tensor 3-D dengan bentuk [num_layer * dir, batch, num_units]. Untuk model lain, diabaikan. params: Tensor 1-D yang berisi bobot dan bias dalam tata letak buram. Ukuran harus dibuat melalui CudnnRNNParamsSize, dan diinisialisasi secara terpisah. Perhatikan bahwa mereka mungkin tidak kompatibel di berbagai generasi. Jadi sebaiknya simpan dan pulihkan sequence_lengths: vektor panjang dari setiap urutan input. output: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [seq_length, batch_size, dir * num_units]. Jika time_major salah, bentuknya adalah [batch_size, seq_length, dir * num_units]. output_h: Bentuk yang sama memiliki input_h. output_c: Bentuk yang sama dengan input_c untuk LSTM. Tensor kosong untuk model lain. is_training: Menunjukkan apakah operasi ini digunakan untuk inferensi atau pelatihan. time_major: Menunjukkan apakah format input/output adalah mayor waktu atau mayor batch. reserve_space: Tensor buram yang dapat digunakan dalam perhitungan backprop. Itu hanya diproduksi jika is_training benar.
Kelas Bersarang
kelas | CudnnRNNV3.Opsi | Atribut opsional untuk CudnnRNNV3 |
Metode Publik
statis <T meluas Nomor> CudnnRNNV3 <T> | |
statis CudnnRNNV3.Options | arah (arah String) |
statis CudnnRNNV3.Options | putus sekolah (Lampung putus sekolah) |
Output <?> | hostReserved () |
statis CudnnRNNV3.Options | inputMode (String inputMode) |
statis CudnnRNNV3.Options | isTraining (Boolean isTraining) |
statis CudnnRNNV3.Options | numProj (Long numProj) |
Output <T> | Output () |
Output <T> | outputC () |
Output <T> | outputH () |
Output <T> | reserveSpace () |
statis CudnnRNNV3.Options | rnnMode (String rnnMode) |
statis CudnnRNNV3.Options | benih (Long biji) |
statis CudnnRNNV3.Options | seed2 (Long seed2) |
statis CudnnRNNV3.Options | timeMajor (Boolean timeMajor) |
Metode yang Diwarisi
Metode Publik
public static CudnnRNNV3 <T> membuat ( Lingkup lingkup, Operan <T> input, Operan <T> inputH, Operan <T> inputC, Operan <T> params, Operan <Integer> sequenceLengths, Options ... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi CudnnRNNV3 baru.
Parameter
cakupan | lingkup saat ini |
---|---|
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru dari CudnnRNNV3