टेंसरफ़्लो:: ऑप्स:: फिक्स्डयूनिग्रामकैंडिडेटसैंपलर:: Attrs

#include <candidate_sampling_ops.h>

फिक्स्डयूनिग्रामकैंडिडेटसैंपलर के लिए वैकल्पिक विशेषता सेटर्स।

सारांश

सार्वजनिक गुण

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

सार्वजनिक समारोह

Distortion (float x)
TF_MUST_USE_RESULT Attrs
विरूपण का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
वैकल्पिक रूप से उपयोगकर्ताओं द्वारा कुछ आरक्षित आईडी को [0, ..., num_reserved_ids) श्रेणी में जोड़ा जा सकता है।
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
यदि बीज या बीज 2 को गैर-शून्य पर सेट किया गया है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीजित किया जाता है।
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
बीज टकराव से बचने के लिए दूसरा बीज।
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
यूनीग्राम गणनाओं या संभावनाओं की एक सूची, क्रमिक क्रम में प्रति आईडी एक।
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
इस फ़ाइल में प्रत्येक मान्य पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।

सार्वजनिक गुण

विरूपण_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

संख्या_आरक्षित_आईडी_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

बीज2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

बीज_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

ठीकरा_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

यूनीग्राम_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

सार्वजनिक समारोह

विरूपण

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

विरूपण का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।

आंतरिक यूनीग्राम वितरण में जोड़ने से पहले प्रत्येक वजन को पहले विरूपण की शक्ति तक बढ़ाया जाता है। परिणामस्वरूप, विरूपण = 1.0 नियमित यूनीग्राम नमूना देता है (जैसा कि वोकैब फ़ाइल द्वारा परिभाषित किया गया है), और विरूपण = 0.0 एक समान वितरण देता है।

डिफ़ॉल्ट 1

संख्या आरक्षित आईडी

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

वैकल्पिक रूप से उपयोगकर्ताओं द्वारा कुछ आरक्षित आईडी को [0, ..., num_reserved_ids) श्रेणी में जोड़ा जा सकता है।

एक उपयोग मामला यह है कि एक विशेष अज्ञात शब्द टोकन का उपयोग आईडी 0 के रूप में किया जाता है। इन आईडी में 0 की नमूना संभावना होगी।

डिफ़ॉल्ट 0 है

न्यूशर्ड्स

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।

यह पैरामीटर ('शार्क' के साथ) उन विभाजनों की संख्या को इंगित करता है जिनका उपयोग समग्र गणना में किया जा रहा है।

डिफ़ॉल्ट 1

बीज

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

यदि बीज या बीज 2 को गैर-शून्य पर सेट किया गया है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीजित किया जाता है।

अन्यथा, यह एक यादृच्छिक बीज द्वारा बोया जाता है।

डिफ़ॉल्ट 0 है

बीज2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

बीज टकराव से बचने के लिए दूसरा बीज।

डिफ़ॉल्ट 0 है

ठीकरा

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।

यह पैरामीटर ('num_shards' के साथ) एक सैंपलर ऑप की विशेष विभाजन संख्या को इंगित करता है, जब विभाजन का उपयोग किया जा रहा हो।

डिफ़ॉल्ट 0 है

यूनीग्राम

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

यूनीग्राम गणनाओं या संभावनाओं की एक सूची, क्रमिक क्रम में प्रति आईडी एक।

वास्तव में vocab_file और unigrams में से एक को इस ऑप को पास किया जाना चाहिए।

डिफ़ॉल्ट रूप से []

वोकैबफ़ाइल

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

इस फ़ाइल में प्रत्येक मान्य पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।

आईडी अनुक्रमिक क्रम में हैं, जो num_reserved_ids से शुरू होती हैं। प्रत्येक पंक्ति में अंतिम प्रविष्टि गिनती या सापेक्ष संभावना के अनुरूप मान होने की उम्मीद है। वास्तव में vocab_file और unigrams में से एक को इस ऑप में पास करने की आवश्यकता है।

डिफ़ॉल्ट रूप से ""