टेक्स्ट कुकबुक

यह पृष्ठ TensorFlow हब के साथ टेक्स्ट डोमेन में समस्याओं को हल करने वाले ज्ञात गाइड और टूल के एक सेट को सूचीबद्ध करता है। यह किसी भी व्यक्ति के लिए एक प्रारंभिक स्थान है जो खरोंच से शुरू करने के बजाय पूर्व-प्रशिक्षित एमएल घटकों का उपयोग करके विशिष्ट एमएल समस्याओं को हल करना चाहता है।

वर्गीकरण

हम उदाहरण भावना, विषाक्तता, लेख की श्रेणी, या किसी अन्य विशेषता के लिए, किसी दिए गए उदाहरण के लिए एक वर्ग की भविष्यवाणी करना चाहते हैं।

पाठ वर्गीकरण ग्राफिक

नीचे दिए गए ट्यूटोरियल एक ही कार्य को विभिन्न दृष्टिकोणों से हल कर रहे हैं और विभिन्न उपकरणों का उपयोग कर रहे हैं।

केरासो

Keras साथ पाठ वर्गीकरण - Keras और TensorFlow डेटासेट के साथ एक IMDB भावना वर्गीकारक के निर्माण के लिए उदाहरण।

क़ीमत लगानेवाला

पाठ वर्गीकरण - अनुमानक की सहायता से एक IMDB भावना वर्गीकारक के निर्माण के लिए उदाहरण। इसमें सुधार के लिए कई युक्तियां और एक मॉड्यूल तुलना अनुभाग शामिल है।

बर्ट

TF हब पर बर्ट के साथ भविष्यवाणी फिल्म समीक्षा भावना - शो कैसे वर्गीकरण के लिए एक बर्ट मॉड्यूल का उपयोग करने के लिए। का उपयोग भी शामिल bert tokenization और पूर्व प्रसंस्करण के लिए पुस्तकालय।

कागले

Kaggle पर IMDB वर्गीकरण - शो कितनी आसानी से एक Colab से एक Kaggle प्रतियोगिता, डेटा डाउनलोड करने और परिणाम प्रस्तुत करने सहित के साथ बातचीत करने।

क़ीमत लगानेवाला केरासो TF2 टीएफ डेटासेट बर्ट कागल एपीआई
पाठ वर्गीकरण किया हुआ
केरासो के साथ पाठ वर्गीकरण किया हुआकिया हुआकिया हुआ
TF हब पर BERT के साथ मूवी रिव्यू सेंटिमेंट की भविष्यवाणी करना किया हुआकिया हुआ
कागल पर आईएमडीबी वर्गीकरण किया हुआकिया हुआ

FastText एम्बेडिंग के साथ बांग्ला कार्य

TensorFlow हब वर्तमान में प्रत्येक भाषा में एक मॉड्यूल प्रदान नहीं करता है। निम्नलिखित ट्यूटोरियल दिखाता है कि तेजी से प्रयोग और मॉड्यूलर एमएल विकास के लिए TensorFlow हब का लाभ कैसे उठाया जाए।

बांग्ला अनुच्छेद वर्गीकरणकर्ता - एक पुन: प्रयोज्य TensorFlow हब पाठ एम्बेडिंग बनाने का तरीका है, और इसका इस्तेमाल करने के लिए एक Keras वर्गीकारक प्रशिक्षित करने के लिए यह दर्शाता है चारण बांग्ला अनुच्छेद डाटासेट

सिमेंटिक समानता

जब हम यह पता लगाना चाहते हैं कि शून्य-शॉट सेटअप में कौन से वाक्य एक-दूसरे से संबंधित हैं (कोई प्रशिक्षण उदाहरण नहीं)।

सिमेंटिक समानता ग्राफिक

बुनियादी

सिमेंटिक समानता - शो कैसे वाक्य समानता की गणना करने की सजा एनकोडर मॉड्यूल का उपयोग करने के लिए।

क्रॉस बहुभाषी

क्रॉस बहुभाषी अर्थ समानता - शो कैसे भाषाओं में गणना की सजा समानता के पार बहुभाषी वाक्य एनकोडर से एक का उपयोग करने के लिए।

सिमेंटिक रिट्रीवल

सिमेंटिक पुनर्प्राप्ति - शो कैसे क्यू / अर्थ समानता के आधार पर बहाली के लिए दस्तावेजों का संग्रह सूचकांक करने के लिए एक वाक्य एनकोडर उपयोग करने के लिए।

वाक्य टुकड़ा इनपुट

सार्वभौमिक एनकोडर लाइट के साथ अर्थ समानता - शो कैसे वाक्य एनकोडर मॉड्यूल को स्वीकार उपयोग करने के लिए SentencePiece बजाय इनपुट पाठ पर आईडी।

मॉड्यूल निर्माण

इसके बजाय पर केवल मॉड्यूल का उपयोग करने का hub.tensorflow.google.cn , वहाँ खुद मॉड्यूल बनाने के लिए तरीके हैं। यह बेहतर एमएल कोडबेस मॉड्युलैरिटी और आगे साझा करने के लिए एक उपयोगी उपकरण हो सकता है।

मौजूदा पूर्व-प्रशिक्षित एम्बेडिंग को लपेटना

पाठ embedding मॉड्यूल निर्यातक - रैप करने के लिए एक मौजूदा पूर्व प्रशिक्षित एक मॉड्यूल में एम्बेड करने के लिए एक उपकरण। मॉड्यूल में टेक्स्ट प्री-प्रोसेसिंग ऑप्स को शामिल करने का तरीका दिखाता है। यह टोकन एम्बेडिंग से एक वाक्य एम्बेडिंग मॉड्यूल बनाने की अनुमति देता है।

पाठ embedding मॉड्यूल निर्यातक वी 2 - ऊपर के रूप में ही है, लेकिन TensorFlow 2 और उत्सुक निष्पादन के साथ संगत।