מדריכי עיבוד הטקסט של TensorFlow מספקים הוראות שלב אחר שלב לפתרון בעיות נפוצות של טקסט ועיבוד שפה טבעית (NLP).
TensorFlow מספקת שני פתרונות לעיבוד טקסט ושפה טבעית: KerasNLP ו-TensorFlow Text. KerasNLP היא ספריית NLP ברמה גבוהה הכוללת את כל הדגמים העדכניים ביותר מבוססי Transformer וכן כלי עזר לטוקניזציה ברמה נמוכה יותר. זה הפתרון המומלץ עבור רוב מקרי השימוש ב-NLP.
אם אתה צריך גישה לכלי עיבוד טקסט ברמה נמוכה יותר, אתה יכול להשתמש ב- TensorFlow Text. TensorFlow Text מספק אוסף של פעולות וספריות כדי לעזור לך לעבוד עם קלט בצורת טקסט כגון מחרוזות טקסט גולמיות או מסמכים.
KerasNLP
- תחילת העבודה עם KerasNLP : למד KerasNLP על ידי ביצוע ניתוח סנטימנטים ברמות מורכבות מתקדמת, משימוש במודל מאומן מראש ועד לבניית שנאי משלך מאפס.
יצירת טקסט
- יצירת טקסט עם RNN : צור טקסט באמצעות RNN מבוסס תווים ומערך נתונים של כתיבתו של שייקספיר.
- תרגום מכונה עצבית עם תשומת לב : אימון מודל רצף לרצף (seq2seq) לתרגום ספרדית לאנגלית.
- תרגום מכונה עצבית עם שנאי וקרס : צור ואמן מודל שנאי מרצף לרצף לתרגום פורטוגזית לאנגלית.
- כיתוב תמונה עם תשומת לב ויזואלית : צור כתוביות תמונה באמצעות מודל מפענח שנאי הבנוי עם שכבות קשב.
סיווג טקסט
- סיווג טקסט עם BERT : כוונן את BERT כדי לבצע ניתוח סנטימנטים על מערך נתונים של ביקורות סרטי IMDb בטקסט רגיל.
- סיווג טקסט עם RNN : אמן RNN לבצע ניתוח סנטימנט על ביקורות סרטים ב-IMDb.
- TF.Text Metrics : למד על המדדים הזמינים דרך TensorFlow Text. הספרייה מכילה יישומים של מדדי דמיון טקסט כגון ROUGE-L, אשר ניתן להשתמש בהם להערכה אוטומטית של מודלים של יצירת טקסט.
NLP עם BERT
- פתרו משימות GLUE באמצעות BERT ב-TPU : למד כיצד לכוונן את BERT למשימות ממדד ה-GLUE .
- כוונון עדין של דגם BERT : כוונון עדין של דגם BERT באמצעות TensorFlow Model Garden .
- לימוד שפה עמוקה עם BERT-SNGP מודע לחוסר ודאות : החל SNGP על משימה של הבנת שפה טבעית (NLU). בהתבסס על מקודד BERT, תשפר את היכולת של מודל ה-NLU לזהות שאילתות מחוץ לתחום.
הטבעות
- הטמעות מילים : אמן את הטמעות המילים שלך באמצעות מודל פשוט של Keras עבור משימת סיווג רגשות, ולאחר מכן דמיינו אותן באמצעות מקרן הטבעה .
- מטריצת שכבה להטמעת התחלה חמה : למד כיצד "להתחיל בחום" אימון עבור מודל סיווג רגשות טקסט.
- word2vec : אמן מודל word2vec על מערך נתונים קטן ודמיין את ההטמעות המאומנות במקרן ההטמעה .