7 ডিসেম্বর এমএল সিম্পোজিয়ামে মহিলাদের অংশগ্রহণ করুন এখনই নিবন্ধন করুন৷

সেন্সরফ্লো :: অপস :: ফিক্সড ইউনিগ্রামক্যান্ডিডেটস্যাম্পলার :: আতর

#include <candidate_sampling_ops.h>

ফিক্সড ইউনিকগ্রামক্যান্ডিডেটস্যাম্পলারের জন্য .চ্ছিক বৈশিষ্ট্য সেটটার ters

সারসংক্ষেপ

জনসাধারণের গুণাবলী

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

পাবলিক ফাংশন

Distortion (float x)
TF_MUST_USE_RESULT Attrs
বিকৃতিটি ইউনিগ্রাম সম্ভাব্যতা বন্টনকে স্কিউ করতে ব্যবহৃত হয়।
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Byচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীর দ্বারা [0, ..., num_remitted_ids) পরিসীমাতে যুক্ত করা যেতে পারে।
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
সমান্তরালতার মাধ্যমে পুরো গণনার গতি বাড়ানোর জন্য একটি নমুনা মূল পরিসরের একটি উপসেট থেকে নমুনা হিসাবে ব্যবহার করা যেতে পারে।
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
যদি বীজ বা বীজ 2 হয় অ-শূন্য হিসাবে সেট করা থাকে, এলোমেলো সংখ্যা জেনারেটর প্রদত্ত বীজ দ্বারা বীজযুক্ত হয়।
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
বীজের সংঘর্ষ এড়াতে দ্বিতীয় বীজ।
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
সমান্তরালতার মাধ্যমে পুরো গণনার গতি বাড়ানোর জন্য একটি নমুনা মূল পরিসরের একটি উপসেট থেকে নমুনা হিসাবে ব্যবহার করা যেতে পারে।
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
অনুক্রমিক ক্রম অনুসারে ইউনিট গণনা বা সম্ভাবনার তালিকা, প্রতি আইডি প্রতি একটি।
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
এই ফাইলে প্রতিটি বৈধ লাইন (যার একটি CSV- এর মতো ফর্ম্যাট হওয়া উচিত) একটি বৈধ শব্দের ID এর সাথে সম্পর্কিত।

জনসাধারণের গুণাবলী

বিকৃতি_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_re محفوظ_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

নাম_শার্ডস_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

বীজ 2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

বীজ_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

শারড_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

ইউনিগ্রাম_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

ভোকাব_ফাইল_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

পাবলিক ফাংশন

বিকৃতি

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

বিকৃতিটি ইউনিগ্রাম সম্ভাব্যতা বন্টনকে স্কিউ করতে ব্যবহৃত হয়।

অভ্যন্তরীণ ইউনিগ্রাম বিতরণ যোগ করার আগে প্রতিটি ওজন প্রথমে বিকৃতির শক্তিতে উত্থাপিত হয়। ফলস্বরূপ, বিকৃতি = 1.0 নিয়মিত ইউনিগ্রাম নমুনা দেয় (ভোকাব ফাইল দ্বারা সংজ্ঞায়িত), এবং বিকৃতি = 0.0 একটি অভিন্ন বিতরণ দেয়।

ডিফল্ট 1

নম্বরের রিজার্ভড আইডিএস

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Byচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীর দ্বারা [0, ..., num_remitted_ids) পরিসীমাতে যুক্ত করা যেতে পারে।

একটি ব্যবহারের ক্ষেত্রে হ'ল একটি বিশেষ অজানা শব্দ টোকেন আইডি 0 হিসাবে ব্যবহৃত হয় These এই আইডিগুলিতে 0 এর নমুনা সম্ভাবনা থাকে।

ডিফল্ট 0

নামশার্ডস

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

সমান্তরালতার মাধ্যমে পুরো গণনার গতি বাড়ানোর জন্য একটি নমুনা মূল পরিসরের একটি উপসেট থেকে নমুনা হিসাবে ব্যবহার করা যেতে পারে।

এই প্যারামিটার (একসাথে 'শারদ') সামগ্রিক গণনায় ব্যবহৃত পার্টিশনের সংখ্যা নির্দেশ করে।

ডিফল্ট 1

বীজ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

যদি বীজ বা বীজ 2 হয় অ-শূন্য হিসাবে সেট করা থাকে, এলোমেলো সংখ্যা জেনারেটর প্রদত্ত বীজ দ্বারা বীজযুক্ত হয়।

অন্যথায়, এটি এলোমেলো বীজ দ্বারা বপন করা হয়।

ডিফল্ট 0

বীজ 2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

বীজের সংঘর্ষ এড়াতে দ্বিতীয় বীজ।

ডিফল্ট 0

তীক্ষ্ণ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

সমান্তরালতার মাধ্যমে পুরো গণনার গতি বাড়ানোর জন্য একটি নমুনা মূল পরিসরের একটি উপসেট থেকে নমুনা হিসাবে ব্যবহার করা যেতে পারে।

এই প্যারামিটার (একসাথে 'num_shards') পার্টিশন ব্যবহার করার সময় একটি নমুনা অপের নির্দিষ্ট পার্টিশন নম্বর নির্দেশ করে।

ডিফল্ট 0

ইউনিগ্রামে

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

অনুক্রমিক ক্রম অনুসারে ইউনিট গণনা বা সম্ভাবনার তালিকা, প্রতি আইডি প্রতি একটি।

হুবহু ভোকাব_ফাইল এবং ইউনিগ্রামগুলির মধ্যে একটি এই বিকল্পটিতে পাস করা উচিত।

[] এর ডিফল্ট

ভোক্যাবফিল

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

এই ফাইলে প্রতিটি বৈধ লাইন (যার একটি CSV- এর মতো ফর্ম্যাট হওয়া উচিত) একটি বৈধ শব্দের ID এর সাথে সম্পর্কিত।

আইডিগুলি num_reided_ids থেকে শুরু করে ক্রমানুসারে থাকে। প্রতিটি লাইনে শেষ এন্ট্রি গণনা বা আপেক্ষিক সম্ভাবনার সাথে সম্পর্কিত একটি মান হিসাবে প্রত্যাশিত। হুবহু একটি ভোকাব_ফাইল এবং ইউনিগ্রামের এই বিকল্পটিতে পাস করা দরকার।

"" এ ডিফল্ট