টেনসরফ্লো :: অপস:: FixedUnigram CandidateSampler:: Attrs

#include <candidate_sampling_ops.h>

FixedUnigramCandidateSampler- এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার।

সারাংশ

পাবলিক বৈশিষ্ট্য

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

পাবলিক ফাংশন

Distortion (float x)
TF_MUST_USE_RESULT Attrs
ইউনিগ্রাম সম্ভাব্যতা বন্টন তির্যক করতে বিকৃতি ব্যবহার করা হয়।
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
ঐচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীদের দ্বারা [0, ..., num_reserved_ids) পরিসরে যোগ করা যেতে পারে।
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
যদি বীজ বা বীজ2 অ-শূন্য হিসাবে সেট করা হয়, তাহলে প্রদত্ত বীজ দ্বারা এলোমেলো সংখ্যা জেনারেটর বীজ হয়।
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
একটি দ্বিতীয় বীজ বীজ সংঘর্ষ এড়াতে.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
ইউনিগ্রাম গণনা বা সম্ভাব্যতার একটি তালিকা, প্রতি আইডি ক্রমানুসারে একটি।
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
এই ফাইলের প্রতিটি বৈধ লাইন (যার একটি CSV-এর মতো বিন্যাস থাকা উচিত) একটি বৈধ শব্দ ID-এর সাথে মিলে যায়৷

পাবলিক বৈশিষ্ট্য

বিকৃতি_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

সংখ্যা_সংরক্ষিত_আইডি_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

সংখ্যা_শার্ডস_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

বীজ2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

বীজ_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

শার্ড_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

ইউনিগ্রাম_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

ভোকাব_ফাইল_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

পাবলিক ফাংশন

বিকৃতি

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

ইউনিগ্রাম সম্ভাব্যতা বন্টন তির্যক করতে বিকৃতি ব্যবহার করা হয়।

অভ্যন্তরীণ ইউনিগ্রাম বিতরণে যোগ করার আগে প্রতিটি ওজন প্রথমে বিকৃতির শক্তিতে উত্থাপিত হয়। ফলস্বরূপ, বিকৃতি = 1.0 নিয়মিত ইউনিগ্রাম স্যাম্পলিং দেয় (ভোকাব ফাইল দ্বারা সংজ্ঞায়িত), এবং বিকৃতি = 0.0 একটি অভিন্ন বন্টন দেয়।

ডিফল্ট 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

ঐচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীদের দ্বারা [0, ..., num_reserved_ids) পরিসরে যোগ করা যেতে পারে।

একটি ব্যবহারের ক্ষেত্রে একটি বিশেষ অজানা শব্দ টোকেন আইডি 0 হিসাবে ব্যবহৃত হয়। এই আইডিগুলির নমুনা সম্ভাবনা 0 হবে।

ডিফল্ট 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।

এই প্যারামিটারটি (একসাথে 'শার্ড'-এর সাথে) সামগ্রিক গণনায় ব্যবহৃত পার্টিশনের সংখ্যা নির্দেশ করে।

ডিফল্ট 1

বীজ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

যদি বীজ বা বীজ2 অ-শূন্য হিসাবে সেট করা হয়, তাহলে প্রদত্ত বীজ দ্বারা এলোমেলো সংখ্যা জেনারেটর বীজ হয়।

অন্যথায়, এটি একটি এলোমেলো বীজ দ্বারা বীজ হয়।

ডিফল্ট 0

বীজ ২

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

একটি দ্বিতীয় বীজ বীজ সংঘর্ষ এড়াতে.

ডিফল্ট 0

শার্ড

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে।

এই প্যারামিটার (একসাথে 'সংখ্যা_শার্ড') একটি স্যাম্পলার অপের নির্দিষ্ট পার্টিশন নম্বর নির্দেশ করে, যখন পার্টিশন ব্যবহার করা হচ্ছে।

ডিফল্ট 0

ইউনিগ্রাম

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

ইউনিগ্রাম গণনা বা সম্ভাব্যতার একটি তালিকা, প্রতি আইডি ক্রমানুসারে একটি।

vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করা উচিত।

ডিফল্ট থেকে []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

এই ফাইলের প্রতিটি বৈধ লাইন (যার একটি CSV-এর মতো বিন্যাস থাকা উচিত) একটি বৈধ শব্দ ID-এর সাথে মিলে যায়৷

আইডিগুলি ক্রমানুসারে, num_reserved_ids থেকে শুরু করে। প্রতিটি লাইনের শেষ এন্ট্রিটি গণনা বা আপেক্ষিক সম্ভাব্যতার সাথে সম্পর্কিত একটি মান হবে বলে আশা করা হচ্ছে। vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করতে হবে।

ডিফল্ট ""