টেনসরফ্লো :: অপস:: FixedUnigram CandidateSampler:: Attrs
#include <candidate_sampling_ops.h>
FixedUnigramCandidateSampler- এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার।
সারাংশ
পাবলিক বৈশিষ্ট্য | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
পাবলিক ফাংশন | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs ইউনিগ্রাম সম্ভাব্যতা বন্টন তির্যক করতে বিকৃতি ব্যবহার করা হয়। |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs ঐচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীদের দ্বারা [0, ..., num_reserved_ids) পরিসরে যোগ করা যেতে পারে। |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে। |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs যদি বীজ বা বীজ2 অ-শূন্য হিসাবে সেট করা হয়, তাহলে প্রদত্ত বীজ দ্বারা এলোমেলো সংখ্যা জেনারেটর বীজ হয়। |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs একটি দ্বিতীয় বীজ বীজ সংঘর্ষ এড়াতে. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে। |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs ইউনিগ্রাম গণনা বা সম্ভাব্যতার একটি তালিকা, প্রতি আইডি ক্রমানুসারে একটি। |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs এই ফাইলের প্রতিটি বৈধ লাইন (যার একটি CSV-এর মতো বিন্যাস থাকা উচিত) একটি বৈধ শব্দ ID-এর সাথে মিলে যায়৷ |
পাবলিক বৈশিষ্ট্য
বিকৃতি_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
সংখ্যা_সংরক্ষিত_আইডি_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
সংখ্যা_শার্ডস_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
বীজ2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
বীজ_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
শার্ড_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
ইউনিগ্রাম_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
ভোকাব_ফাইল_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
পাবলিক ফাংশন
বিকৃতি
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
ইউনিগ্রাম সম্ভাব্যতা বন্টন তির্যক করতে বিকৃতি ব্যবহার করা হয়।
অভ্যন্তরীণ ইউনিগ্রাম বিতরণে যোগ করার আগে প্রতিটি ওজন প্রথমে বিকৃতির শক্তিতে উত্থাপিত হয়। ফলস্বরূপ, বিকৃতি = 1.0 নিয়মিত ইউনিগ্রাম স্যাম্পলিং দেয় (ভোকাব ফাইল দ্বারা সংজ্ঞায়িত), এবং বিকৃতি = 0.0 একটি অভিন্ন বন্টন দেয়।
ডিফল্ট 1
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
ঐচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীদের দ্বারা [0, ..., num_reserved_ids) পরিসরে যোগ করা যেতে পারে।
একটি ব্যবহারের ক্ষেত্রে একটি বিশেষ অজানা শব্দ টোকেন আইডি 0 হিসাবে ব্যবহৃত হয়। এই আইডিগুলির নমুনা সম্ভাবনা 0 হবে।
ডিফল্ট 0
NumShards
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।
এই প্যারামিটারটি (একসাথে 'শার্ড'-এর সাথে) সামগ্রিক গণনায় ব্যবহৃত পার্টিশনের সংখ্যা নির্দেশ করে।
ডিফল্ট 1
বীজ
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
যদি বীজ বা বীজ2 অ-শূন্য হিসাবে সেট করা হয়, তাহলে প্রদত্ত বীজ দ্বারা এলোমেলো সংখ্যা জেনারেটর বীজ হয়।
অন্যথায়, এটি একটি এলোমেলো বীজ দ্বারা বীজ হয়।
ডিফল্ট 0
বীজ ২
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
একটি দ্বিতীয় বীজ বীজ সংঘর্ষ এড়াতে.
ডিফল্ট 0
শার্ড
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।
এই প্যারামিটার (একসাথে 'সংখ্যা_শার্ড') একটি স্যাম্পলার অপের নির্দিষ্ট পার্টিশন নম্বর নির্দেশ করে, যখন পার্টিশন ব্যবহার করা হচ্ছে।
ডিফল্ট 0
ইউনিগ্রাম
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
ইউনিগ্রাম গণনা বা সম্ভাব্যতার একটি তালিকা, প্রতি আইডি ক্রমানুসারে একটি।
vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করা উচিত।
ডিফল্ট থেকে []
VocabFile
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
এই ফাইলের প্রতিটি বৈধ লাইন (যার একটি CSV-এর মতো বিন্যাস থাকা উচিত) একটি বৈধ শব্দ ID-এর সাথে মিলে যায়৷
আইডিগুলি ক্রমানুসারে, num_reserved_ids থেকে শুরু করে। প্রতিটি লাইনের শেষ এন্ট্রিটি গণনা বা আপেক্ষিক সম্ভাব্যতার সাথে সম্পর্কিত একটি মান হবে বলে আশা করা হচ্ছে। vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করতে হবে।
ডিফল্ট ""