cuDNN দ্বারা সমর্থিত একটি RNN।
প্যারামস বাফারের সাপেক্ষে ইনপুট এবং প্রাথমিক অবস্থা থেকে RNN গণনা করে। CudnnRNN এর চেয়ে একটি অতিরিক্ত ইনপুট "sequence_lengths" গ্রহণ করে।
rnn_mode: RNN মডেলের ধরন নির্দেশ করে। input_mode: প্রথম স্তরের আগে ইনপুট এবং প্রকৃত গণনার মধ্যে একটি রৈখিক অভিক্ষেপ আছে কিনা তা নির্দেশ করে। 'skip_input' শুধুমাত্র তখনই অনুমোদিত যখন input_size == num_units; 'স্বয়ংক্রিয়_নির্বাচন' বোঝায় 'skip_input' যখন input_size == num_units; অন্যথায়, এটি 'লিনিয়ার_ইনপুট' বোঝায়। দিকনির্দেশ: একটি দ্বিমুখী মডেল ব্যবহার করা হবে কিনা তা নির্দেশ করে। "একমুখী" বা "দ্বিমুখী" হওয়া উচিত। dropout: ড্রপআউট সম্ভাবনা। 0 এ সেট করা হলে, ড্রপআউট অক্ষম করা হয়। বীজ: ড্রপআউট শুরু করার জন্য একটি বীজের 1ম অংশ। বীজ 2: ড্রপআউট শুরু করার জন্য একটি বীজের 2য় অংশ। ইনপুট: time_major সত্য হলে, এটি একটি 3-D টেনসর যার আকার [seq_length, batch_size, input_size]। টাইম_মেজর মিথ্যা হলে, আকৃতিটি [ব্যাচ_সাইজ, সেক_লেংথ, ইনপুট_সাইজ]। input_h: time_major সত্য হলে, এটি একটি 3-D টেনসর যার আকার [num_layer * dir, batch_size, num_units]। যদি time_major মিথ্যা হয়, তাহলে আকৃতি হবে [batch_size, num_layer * dir, num_units]। input_c: LSTM-এর জন্য, [num_layer * dir, batch, num_units] এর আকৃতি সহ একটি 3-D টেনসর। অন্যান্য মডেলের জন্য, এটি উপেক্ষা করা হয়। প্যারামস: একটি 1-ডি টেনসর যা একটি অস্বচ্ছ বিন্যাসে ওজন এবং পক্ষপাত ধারণ করে। আকার CudnnRNNParamsSize এর মাধ্যমে তৈরি করতে হবে এবং আলাদাভাবে শুরু করতে হবে। মনে রাখবেন যে তারা বিভিন্ন প্রজন্মের সাথে সামঞ্জস্যপূর্ণ নাও হতে পারে। তাই sequence_lengths সংরক্ষণ এবং পুনরুদ্ধার করা একটি ভাল ধারণা: প্রতিটি ইনপুট অনুক্রমের দৈর্ঘ্যের একটি ভেক্টর। আউটপুট: যদি time_major সত্য হয় তবে এটি একটি 3-D টেনসর যার আকার [seq_length, batch_size, dir * num_units]। যদি time_major মিথ্যা হয়, তাহলে আকৃতি হবে [batch_size, seq_length, dir * num_units]। output_h: একই আকৃতির input_h আছে। output_c: LSTM-এর জন্য input_c-এর মতো একই আকৃতি। অন্যান্য মডেলের জন্য একটি খালি টেনসর। is_training: এই অপারেশনটি অনুমান বা প্রশিক্ষণের জন্য ব্যবহার করা হয় কিনা তা নির্দেশ করে। time_major: ইনপুট/আউটপুট ফরম্যাট টাইম মেজর নাকি ব্যাচ মেজর তা নির্দেশ করে। রিজার্ভ_স্পেস: একটি অস্বচ্ছ টেনসর যা ব্যাকপ্রপ গণনায় ব্যবহার করা যেতে পারে। এটা শুধুমাত্র যদি is_training সত্য হয় উত্পাদিত হয়.
নেস্টেড ক্লাস
ক্লাস | CudnnRNNV3. অপশন | CudnnRNNV3 এর জন্য ঐচ্ছিক বৈশিষ্ট্য |
পাবলিক পদ্ধতি
static <T প্রসারিত সংখ্যা> CudnnRNNV3 <T> | |
স্ট্যাটিক CudnnRNNV3. অপশন | দিক (স্ট্রিং দিক) |
স্ট্যাটিক CudnnRNNV3. অপশন | ড্রপআউট (ফ্লোট ড্রপআউট) |
আউটপুট <?> | |
স্ট্যাটিক CudnnRNNV3. অপশন | ইনপুটমোড (স্ট্রিং ইনপুটমোড) |
স্ট্যাটিক CudnnRNNV3. অপশন | isTraining (বুলিয়ান isTraining) |
স্ট্যাটিক CudnnRNNV3. অপশন | numProj (লং numProj) |
আউটপুট <T> | আউটপুট () |
আউটপুট <T> | আউটপুট সি () |
আউটপুট <T> | আউটপুটH () |
আউটপুট <T> | |
স্ট্যাটিক CudnnRNNV3. অপশন | rnnMode (স্ট্রিং rnnMode) |
স্ট্যাটিক CudnnRNNV3. অপশন | বীজ (দীর্ঘ বীজ) |
স্ট্যাটিক CudnnRNNV3. অপশন | বীজ 2 (লম্বা বীজ 2) |
স্ট্যাটিক CudnnRNNV3. অপশন | টাইমমেজর (বুলিয়ান টাইমমেজর) |
উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি
পাবলিক পদ্ধতি
পাবলিক স্ট্যাটিক CudnnRNNV3 <T> তৈরি করুন ( স্কোপ স্কোপ, Operand <T> ইনপুট, Operand <T> inputH, Operand <T> inputC, Operand <T> params, Operand <Integer> ক্রমদৈর্ঘ্য, বিকল্প... বিকল্প)
একটি নতুন CudnnRNNV3 অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
পরামিতি
সুযোগ | বর্তমান সুযোগ |
---|---|
বিকল্প | ঐচ্ছিক বৈশিষ্ট্য মান বহন করে |
রিটার্নস
- CudnnRNNV3 এর একটি নতুন উদাহরণ