tensorflow:: אופס:: UnicodeTranscode:: Attrs

#include <string_ops.h>

קובעי תכונות אופציונליים עבור UnicodeTranscode .

תַקצִיר

תכונות ציבוריות

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

תפקידים ציבוריים

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
מדיניות טיפול בשגיאות כאשר נמצא עיצוב לא חוקי בקלט.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
האם להחליף את תווי הבקרה C0 (00-1F) ב- replacement_char .
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
נקודת הקוד של התווים החלופיים לשימוש במקום כל עיצוב לא חוקי בקלט כאשר errors='replace' .

תכונות ציבוריות

שגיאות_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

replace_control_characters_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

תחליף_char_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

תפקידים ציבוריים

שגיאות

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

מדיניות טיפול בשגיאות כאשר נמצא עיצוב לא חוקי בקלט.

הערך של 'strict' יגרום לפעולה לייצר שגיאת InvalidArgument בכל עיצוב קלט לא חוקי. ערך 'replace' (ברירת המחדל) יגרום לפעולה להחליף כל עיצוב לא חוקי בקלט בנקודת הקוד replacement_char . ערך של 'התעלם' יגרום לפעולה לדלג על כל עיצוב לא חוקי בקלט ולא לייצר תו פלט מתאים.

ברירת המחדל היא "החלפה"

החלף תווי שליטה

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

האם להחליף את תווי הבקרה C0 (00-1F) ב- replacement_char .

ברירת המחדל היא שקר.

ברירת המחדל ל-false

החלפת Char

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

נקודת הקוד של התווים החלופיים לשימוש במקום כל עיצוב לא חוקי בקלט כאשר errors='replace' .

ניתן להשתמש בכל נקודת קוד חוקית של Unicode. ערך ברירת המחדל הוא תו החלפת ה-unicode המוגדר כברירת מחדל הוא 0xFFFD או U+65533.)

שים לב שעבור UTF-8, העברת תו חלופי שניתן לביטוי בבתים 1, כגון ' ', ישמר את יישור המחרוזת למקור שכן בתים לא חוקיים יוחלפו בתחליף של בתים אחד. עבור UTF-16-BE ו-UTF-16-LE, כל תו החלפת בתים של 1 או 2 ישמור את יישור בתים למקור.

ברירת המחדל היא 65533