FixedUnigramCandidateSampler.Options

सार्वजनिक स्थैतिक वर्ग फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस

FixedUnigramCandidateSampler के लिए वैकल्पिक विशेषताएँ

सार्वजनिक तरीके

फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
विरूपण (फ्लोट विरूपण)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
numReservedIds (लंबी numReservedIds)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
numShards (लंबे numShards)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
बीज (लंबा बीज)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
बीज2 (लंबा बीज2)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
शार्ड (लंबा शार्ड)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
यूनीग्राम (सूची<फ्लोट> यूनीग्राम)
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प
वोकैबफ़ाइल (स्ट्रिंग वोकैबफ़ाइल)

विरासत में मिली विधियाँ

सार्वजनिक तरीके

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प विरूपण (फ्लोट विरूपण)

पैरामीटर
विरूपण विरूपण का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है। आंतरिक यूनीग्राम वितरण में जोड़ने से पहले प्रत्येक वजन को पहले विरूपण की शक्ति तक बढ़ाया जाता है। परिणामस्वरूप, विरूपण = 1.0 नियमित यूनीग्राम नमूना देता है (जैसा कि वोकैब फ़ाइल द्वारा परिभाषित किया गया है), और विरूपण = 0.0 एक समान वितरण देता है।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.विकल्प संख्या आरक्षित आईडी (लंबी संख्या आरक्षित आईडी)

पैरामीटर
numReservedIds वैकल्पिक रूप से उपयोगकर्ताओं द्वारा कुछ आरक्षित आईडी को [0, ..., num_reserved_ids) श्रेणी में जोड़ा जा सकता है। एक उपयोग मामला यह है कि एक विशेष अज्ञात शब्द टोकन का उपयोग आईडी 0 के रूप में किया जाता है। इन आईडी में 0 की नमूना संभावना होगी।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस संख्याशर्ड्स (लंबी संख्याशार्ड्स)

पैरामीटर
numShards समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है। यह पैरामीटर ('शार्क' के साथ) उन विभाजनों की संख्या को इंगित करता है जिनका उपयोग समग्र गणना में किया जा रहा है।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शन बीज (लंबा बीज)

पैरामीटर
बीज यदि बीज या बीज 2 को गैर-शून्य पर सेट किया गया है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीजित किया जाता है। अन्यथा, यह एक यादृच्छिक बीज द्वारा बोया जाता है।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस सीड2 (लंबा सीड2)

पैरामीटर
बीज2 बीज टकराव से बचने के लिए दूसरा बीज।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस शार्ड (लंबा शार्ड)

पैरामीटर
ठीकरा समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है। यह पैरामीटर ('num_shards' के साथ) एक सैंपलर ऑप की विशेष विभाजन संख्या को इंगित करता है, जब विभाजन का उपयोग किया जा रहा हो।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस यूनिग्राम (सूची<फ्लोट> यूनिग्राम)

पैरामीटर
यूनीग्राम यूनीग्राम गणनाओं या संभावनाओं की एक सूची, क्रमिक क्रम में प्रति आईडी एक। वास्तव में vocab_file और unigrams में से एक को इस ऑप को पास किया जाना चाहिए।

सार्वजनिक फिक्स्डयूनिग्रामकैंडिडेटसैंपलर.ऑप्शंस वोकैबफाइल (स्ट्रिंग वोकैबफाइल)

पैरामीटर
vocabफ़ाइल इस फ़ाइल में प्रत्येक मान्य पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है। आईडी अनुक्रमिक क्रम में हैं, जो num_reserved_ids से शुरू होती हैं। प्रत्येक पंक्ति में अंतिम प्रविष्टि गिनती या सापेक्ष संभावना के अनुरूप मान होने की उम्मीद है। वास्तव में vocab_file और unigrams में से एक को इस ऑप में पास करने की आवश्यकता है।