כיתה גמר ציבורית StringNGrams
יוצר ngrams מנתוני מחרוזת מרופטים.
אופציה זו מקבלת טנזור מרופט עם ממד מרופט אחד המכיל רק מיתרים ומוציא טנזור מרופט עם ממד מרופט אחד המכיל ngrams של מיתר זה, מחובר לאורך הציר הפנימי ביותר.
שיטות ציבוריות
סטטי <T מרחיב מספר> StringNGrams <T> | |
פלט <מחרוזת> | ngrams () טנסור הערכים של הפלט ngrams טנסור מרופט. |
פלט <T> | ngramsSplits () טנסור הפיצול של הפלט ngrams טנסור מרופט. |
שיטות בירושה
שיטות ציבוריות
StringNGrams סטטיים ציבוריים <T> יוצרים ( scope scope, Operand <String> data, Operand <T> dataSplits, String separator, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences)
שיטת מפעל ליצירת מחלקה העוטפת פעולת StringNGrams חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
נתונים | טנסור הערכים של טנסור המיתרים המרופטים להכנת ngrams. חייב להיות טנזור מיתר 1D. |
פיצול נתונים | טנסור הפיצולים של טנסור המיתרים המרופטים כדי ליצור ממנו ngrams. |
מפריד | המחרוזת שיש להוסיף בין רכיבי האסימון. השתמש ב-"" ללא מפריד. |
ngramWidths | הגדלים של ngrams ליצור. |
פנקס שמאל | המחרוזת שבה יש להשתמש כדי לרפד את הצד השמאלי של רצף ה-ngram. משמש רק אם pad_width != 0. |
rightPad | המחרוזת שבה יש להשתמש כדי לרפד את הצד הימני של רצף ה-ngram. משמש רק אם pad_width != 0. |
padWidth | מספר רכיבי הריפוד שיש להוסיף לכל צד של כל רצף. שימו לב שהריפוד לעולם לא יהיה גדול מ-'ngram_widths'-1 ללא קשר לערך זה. אם `pad_width=-1`, הוסף אלמנטים `max(ngram_widths)-1`. |
החזרות
- מופע חדש של StringNGrams