GenerateVocabRemapping

सार्वजनिक अंतिम वर्ग जेनरेट वोकैब रीमैपिंग

नई और पुरानी शब्दावली फ़ाइलों के लिए एक पथ देखते हुए, एक रीमैपिंग टेंसर लौटाता है

लंबाई `num_new_vocab`, जहां `रीमैपिंग[i]` में पुरानी शब्दावली में पंक्ति संख्या शामिल है जो नई शब्दावली में पंक्ति `i` से मेल खाती है (लाइन `new_vocab_offset` से शुरू होकर `num_new_vocab` इकाइयों तक), या `- 1` यदि नई शब्दावली में प्रविष्टि `i` पुरानी शब्दावली में नहीं है। यदि `old_vocab_size` -1 का डिफ़ॉल्ट मान नहीं है, तो पुरानी शब्दावली पहली `old_vocab_size` प्रविष्टियों तक सीमित है।

`num_vocab_offset` विभाजित चर मामले में उपयोग को सक्षम बनाता है, और आम तौर पर विभाजन जानकारी की जांच के माध्यम से सेट किया जाना चाहिए। फ़ाइलों का प्रारूप एक टेक्स्ट फ़ाइल होना चाहिए, जिसमें प्रत्येक पंक्ति में शब्दावली के भीतर एक इकाई शामिल होनी चाहिए।

उदाहरण के लिए, `new_vocab_file` के साथ एक टेक्स्ट फ़ाइल जिसमें एक पंक्ति में निम्नलिखित प्रत्येक तत्व शामिल हैं: `[f0, f1, f2, f3]`, Old_vocab_file = [f1, f0, f3], `num_new_vocab = 3, new_vocab_offset = 1`, लौटाई गई रीमैपिंग `[0, -1, 2]` होगी।

ऑप यह गिनती भी लौटाता है कि नई शब्दावली में पुरानी शब्दावली में कितनी प्रविष्टियाँ मौजूद थीं, जिसका उपयोग वेट मैट्रिक्स रीमैपिंग में आरंभ करने के लिए मानों की संख्या की गणना करने के लिए किया जाता है।

इस कार्यक्षमता का उपयोग TensorFlow चौकियों से पंक्ति शब्दावली (आमतौर पर, सुविधाएँ) और स्तंभ शब्दावली (आमतौर पर, कक्षाएं) दोनों को रीमैप करने के लिए किया जा सकता है। ध्यान दें कि विभाजन तर्क विभाजन-विभाजित चर के अनुरूप सन्निहित शब्दावलियों पर निर्भर करता है। इसके अलावा, अंतर्निहित रीमैपिंग एक IndexTable (एक सटीक CuckooTable के विपरीत) का उपयोग करती है, इसलिए क्लाइंट कोड को संबंधित Index_table_from_file() का उपयोग करना चाहिए जैसा कि फ़ीचरकॉलम फ्रेमवर्क करता है (tf.feature_to_id() के विपरीत, जो एक CuckooTable का उपयोग करता है)।

नेस्टेड क्लासेस

कक्षा वोकैब रीमैपिंग विकल्प जेनरेट करें GenerateVocabRemapping के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

स्टेटिक जेनरेट वोकैब रीमैपिंग
बनाएं ( स्कोप स्कोप, ऑपरेंड < TString > newVocabFile, ऑपरेंड < TString > OldVocabFile, लंबा newVocabOffset, लंबा numNewVocab, विकल्प... विकल्प)
एक नया जेनरेटवोकैब रीमैपिंग ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
आउटपुट <TInt32>
संख्यावर्तमान ()
पुरानी शब्दावली में पाई गई नई शब्दावली प्रविष्टियों की संख्या।
स्थैतिक जनरेट वोकैब रीमैपिंग.विकल्प
पुरानावोकैबआकार (लंबा पुरानावोकैबआकार)
आउटपुट <TInt64>
रीमैपिंग ()
लंबाई का एक टेंसर num_new_vocab जहां सूचकांक i पर तत्व पुरानी आईडी के बराबर है जो नई आईडी i पर मैप करता है।

विरासत में मिली विधियाँ

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "जेनरेट वोकैब रीमैपिंग"

सार्वजनिक तरीके

सार्वजनिक स्थैतिक जेनरेट वोकैब रीमैपिंग बनाएं ( स्कोप स्कोप, ऑपरेंड < TString > newVocabFile, ऑपरेंड < TString > OldVocabFile, लंबा newVocabOffset, लंबा numNewVocab, विकल्प... विकल्प)

एक नया जेनरेटवोकैब रीमैपिंग ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
newVocabफ़ाइल नई वोकैब फ़ाइल का पथ.
OldVocabफ़ाइल पुरानी वोकैब फ़ाइल का पथ.
newVocabOffset पढ़ना शुरू करने के लिए नई वोकैब फ़ाइल में कितनी प्रविष्टियाँ हैं।
numNewVocab रीमैप करने के लिए नई वोकैब फ़ाइल में प्रविष्टियों की संख्या।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • GenerateVocabRemapping का एक नया उदाहरण

सार्वजनिक आउटपुट <TInt32> numPresent ()

पुरानी शब्दावली में पाई गई नई शब्दावली प्रविष्टियों की संख्या।

सार्वजनिक स्थैतिक जेनरेट वोकैब रीमैपिंग. विकल्प पुराना वोकैब आकार (लंबा पुराना वोकैब आकार)

पैरामीटर
OldVocabSize विचार करने के लिए पुरानी शब्दावली फ़ाइल में प्रविष्टियों की संख्या। यदि -1, तो संपूर्ण पुरानी शब्दावली का उपयोग करें।

सार्वजनिक आउटपुट <TInt64> रीमैपिंग ()

लंबाई का एक टेंसर num_new_vocab जहां सूचकांक i पर तत्व पुरानी आईडी के बराबर है जो नई आईडी i पर मैप करता है। यह तत्व किसी भी नई आईडी के लिए -1 है जो पुरानी शब्दावली में नहीं पाई जाती है।