كتاب الطبخ النصي

تسرد هذه الصفحة مجموعة من الأدلة والأدوات المعروفة لحل المشكلات في مجال النص باستخدام TensorFlow Hub. إنها نقطة انطلاق لأي شخص يريد حل مشكلات ML النموذجية باستخدام مكونات ML المدربة مسبقًا بدلاً من البدء من نقطة الصفر.

تصنيف

عندما نريد أن التنبؤ فئة لمثال معين، على سبيل المثال المشاعر، سمية، فئة المقال، أو أي صفة أخرى.

رسم تصنيف النص

البرامج التعليمية أدناه تحل نفس المهمة من وجهات نظر مختلفة وتستخدم أدوات مختلفة.

كيراس

تصنيف النص مع Keras - مثال لبناء الثقة المصنف IMDB مع Keras وTensorFlow مجموعات البيانات.

مقدر

تصنيف النص - مثال لبناء الثقة المصنف IMDB مع مقدر. يحتوي على نصائح متعددة للتحسين وقسم مقارنة وحدة.

بيرت

توقع الفيلم الاستعراضي ثقة مع بيرت على TF المحور - يبين كيفية استخدام وحدة بيرت للتصنيف. تشتمل على استخدام bert مكتبة للtokenization وتجهيزها.

Kaggle

تصنيف IMDB على Kaggle - يظهر كيفية بسهولة التفاعل مع المنافسة Kaggle من Colab، بما في ذلك تحميل البيانات وتقديم النتائج.

مقدر كيراس TF2 مجموعات بيانات TF بيرت واجهات برمجة تطبيقات Kaggle
تصنيف النص فعله
تصنيف النص مع Keras فعلهفعلهفعله
توقع رأي مراجعة الفيلم مع BERT على TF Hub فعلهفعله
تصنيف IMDB على Kaggle فعلهفعله

مهمة البنغالية مع التضمينات FastText

لا يقدم TensorFlow Hub حاليًا وحدة في كل لغة. يوضح البرنامج التعليمي التالي كيفية الاستفادة من TensorFlow Hub للتجربة السريعة وتطوير ML المعياري.

البنغالية المادة مصنف يوضح كيفية إنشاء قابلة لإعادة الاستخدام TensorFlow محور تضمين النص، واستخدامها لتدريب المصنف Keras ل- BARD البنغالية المادة بيانات .

التشابه الدلالي

عندما نريد معرفة الجمل التي ترتبط ببعضها البعض في إعداد اللقطة الصفرية (لا توجد أمثلة تدريبية).

رسم التشابه الدلالي

أساسي

التشابه الدلالي - يبين كيفية استخدام وحدة الجملة التشفير لحساب التشابه الجملة.

عبر اللغات

الصليب اللغات التشابه الدلالي - يبين كيفية استخدام أحد أجهزة تشفير الجملة عبر اللغات على حساب الجملة التشابه بين اللغات.

استرجاع دلالي

استرجاع الدلالي - يبين كيفية استخدام Q / A التشفير الحكم إلى مؤشر مجموعة من الوثائق واسترجاعها على أساس التشابه الدلالي.

الجملة إدخال قطعة

التشابه الدلالي مع لايت ترميز عالمي - يبين كيفية استخدام وحدات الجملة التشفير التي تقبل SentencePiece هويات على المدخلات بدلا من النص.

إنشاء وحدة

بدلا من استخدام وحدات الوحيدة على hub.tensorflow.google.cn ، هناك طرق لإنشاء وحدات خاصة. يمكن أن يكون هذا أداة مفيدة لتحسين نمطية قاعدة بيانات ML ولمزيد من المشاركة.

تغليف حفلات الزفاف المدربة مسبقا

نص تضمين وحدة مصدر - أداة للالتفاف موجود المدربين قبل تضمينها في وحدة نمطية. يوضح كيفية تضمين عمليات المعالجة المسبقة للنص في الوحدة النمطية. هذا يسمح بإنشاء وحدة تضمين الجملة من التضمينات الرمزية.

نص تضمين وحدة مصدر V2 - نفسه على النحو الوارد أعلاه، ولكن متوافق مع TensorFlow 2 وتنفيذ متحمسين.