מקודד טנסור של אינטס למחרוזות Unicode.
מחזירה וקטור של מחרוזות, כאשר 'פלט[i]' נבנה על ידי קידוד נקודות הקוד של Unicode ב-'input_values[input_splits[i]:input_splits[i+1]]' באמצעות 'output_encoding'.
---
דוּגמָה:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
כיתות מקוננות
מַחלָקָה | UnicodeEncode.Options | תכונות אופציונליות עבור UnicodeEncode |
שיטות ציבוריות
פלט <מחרוזת> | asOutput () מחזירה את הידית הסמלית של טנזור. |
סטטי <T מרחיב מספר> UnicodeEncode | צור ( scope scope, Operand <Integer> inputValues, Operand <T> inputSplits, String outputEncoding, Options... options) שיטת מפעל ליצירת מחלקה העוטפת פעולת UnicodeEncode חדשה. |
סטטי UnicodeEncode.Options | שגיאות (שגיאות מחרוזות) |
פלט <מחרוזת> | פלט () טנסור 1-D של מחרוזות המקודדות מנקודות הקוד הניתנות ל-unicode. |
סטטי UnicodeEncode.Options | replacementChar (Long replacementChar) |
שיטות בירושה
שיטות ציבוריות
פלט ציבורי <String> asOutput ()
מחזירה את הידית הסמלית של טנזור.
כניסות לפעולות TensorFlow הן יציאות של פעולת TensorFlow אחרת. שיטה זו משמשת להשגת ידית סמלית המייצגת את חישוב הקלט.
יצירת UnicodeEncode סטטית ציבורית ( scope scope, Operand <Integer> inputValues, Operand <T> inputSplits, String outputEncoding, Options... אפשרויות)
שיטת מפעל ליצירת מחלקה העוטפת פעולת UnicodeEncode חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
ערכי קלט | טנזור 1D המכיל את נקודות הקוד של Unicode שיש לקודד. |
inputSplits | טנזור 1D המציין כיצד יש לפצל את נקודות הקוד של Unicode למחרוזות. בפרט, `פלט[i]` נבנה על ידי קידוד נקודות הקוד בפרוסה `input_values[input_splits[i]:input_splits[i+1]]`. |
קידוד פלט | קידוד Unicode של מחרוזות הפלט. קידודים חוקיים הם: `"UTF-8", "UTF-16-BE" ו-"UTF-32-BE"`. |
אפשרויות | נושא ערכי תכונות אופציונליות |
מחזיר
- מופע חדש של UnicodeEncode
שגיאות UnicodeEncode. אפשרויות ציבוריות (שגיאות מחרוזת)
פרמטרים
שגיאות | מדיניות טיפול בשגיאות כאשר נמצא עיצוב לא חוקי בקלט. הערך של 'strict' יגרום לפעולה לייצר שגיאת InvalidArgument בכל עיצוב קלט לא חוקי. ערך 'replace' (ברירת המחדל) יגרום לפעולה להחליף כל עיצוב לא חוקי בקלט בנקודת הקוד 'replacement_char'. ערך של 'התעלם' יגרום לפעולה לדלג על כל עיצוב לא חוקי בקלט ולא לייצר תו פלט מתאים. |
---|
Public static UnicodeEncode.Options replacementChar (Long replacementChar)
פרמטרים
החלפהChar | נקודת הקוד של התווים החלופיים לשימוש במקום כל עיצוב לא חוקי בקלט כאשר `errors='replace'`. ניתן להשתמש בכל נקודת קוד חוקית של Unicode. ערך ברירת המחדל הוא תו החלפת ה-unicode המוגדר כברירת מחדל הוא 0xFFFD (U+65533). |
---|