RNN yang didukung oleh cuDNN.
Menghitung RNN dari input dan status awal, sehubungan dengan buffer params. Menerima satu input tambahan "sequence_lengths" daripada CudnnRNN.
rnn_mode: Menunjukkan jenis model RNN. input_mode: Menunjukkan apakah ada proyeksi linier antara input dan komputasi aktual sebelum lapisan pertama. 'skip_input' hanya diperbolehkan bila input_size == num_units; 'auto_select' menyiratkan 'skip_input' ketika input_size == num_units; jika tidak, ini berarti 'input_linier'. arah: Menunjukkan apakah model dua arah akan digunakan. Harus "searah" atau "dua arah". putus sekolah: Kemungkinan putus sekolah. Jika disetel ke 0, dropout dinonaktifkan. seed: Bagian pertama dari seed untuk menginisialisasi dropout. seed2: Bagian ke-2 dari benih untuk menginisialisasi dropout. masukan: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [seq_length, batch_size, input_size]. Jika time_major salah, bentuknya adalah [batch_size, seq_length, input_size]. input_h: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [num_layer * dir, batch_size, num_units]. Jika time_major salah, bentuknya adalah [batch_size, num_layer * dir, num_units]. input_c: Untuk LSTM, tensor 3-D dengan bentuk [num_layer * dir, batch, num_units]. Untuk model lain diabaikan. params: Tensor 1-D yang berisi bobot dan bias dalam tata letak buram. Ukurannya harus dibuat melalui CudnnRNNParamsSize, dan diinisialisasi secara terpisah. Perhatikan bahwa mereka mungkin tidak kompatibel pada generasi yang berbeda. Jadi sebaiknya simpan dan pulihkan sequence_lengths: vektor panjang setiap urutan masukan. keluaran: Jika time_major benar, ini adalah tensor 3-D dengan bentuk [seq_length, batch_size, dir * num_units]. Jika time_major salah, bentuknya adalah [batch_size, seq_length, dir * num_units]. output_h: Bentuk yang sama memiliki input_h. output_c: Bentuknya sama dengan input_c untuk LSTM. Tensor kosong untuk model lain. is_training: Menunjukkan apakah operasi ini digunakan untuk inferensi atau pelatihan. time_major: Menunjukkan apakah format input/output adalah jurusan waktu atau jurusan batch. Reserve_space: Tensor buram yang dapat digunakan dalam penghitungan backprop. Itu hanya dihasilkan jika is_training benar.
Kelas Bersarang
kelas | CudnnRNNV3.Opsi | Atribut opsional untuk CudnnRNNV3 |
Metode Publik
statis <T memperluas Nomor> CudnnRNNV3 <T> | |
CudnnRNNV3.Opsi statis | arah (arah string) |
CudnnRNNV3.Opsi statis | putus sekolah (putus sekolah mengambang) |
Keluaran <?> | |
CudnnRNNV3.Opsi statis | mode masukan (Mode masukan string) |
CudnnRNNV3.Opsi statis | isTraining (Boolean isTraining) |
CudnnRNNV3.Opsi statis | numProj (NomorProj panjang) |
Keluaran <T> | keluaran () |
Keluaran <T> | keluaranC () |
Keluaran <T> | keluaranH () |
Keluaran <T> | |
CudnnRNNV3.Opsi statis | rnnMode (String rnnMode) |
CudnnRNNV3.Opsi statis | benih (biji panjang) |
CudnnRNNV3.Opsi statis | seed2 (Benih panjang2) |
CudnnRNNV3.Opsi statis | waktuMayor (Waktu BooleanMayor) |
Metode Warisan
Metode Publik
public static CudnnRNNV3 <T> buat ( Cakupan cakupan , masukan Operan <T>, Operan <T> masukanH, Operan <T> masukanC, parameter Operan <T>, Panjang urutan Operan <Bilangan Bulat>, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi CudnnRNNV3 baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru dari CudnnRNNV3