dòng chảy căng:: ôi:: Mã chuyển mã Unicode:: Attr

#include <string_ops.h>

Trình thiết lập thuộc tính tùy chọn cho UnicodeTranscode .

Bản tóm tắt

Thuộc tính công khai

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

Chức năng công cộng

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
Chính sách xử lý lỗi khi tìm thấy định dạng không hợp lệ trong đầu vào.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
Có thay thế các ký tự điều khiển C0 (00-1F) bằng replacement_char hay không.
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
Điểm mã ký tự thay thế sẽ được sử dụng thay cho bất kỳ định dạng không hợp lệ nào trong dữ liệu đầu vào khi errors='replace' .

Thuộc tính công khai

lỗi_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

thay thế_control_characters_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

thay thế_char_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

Chức năng công cộng

Lỗi

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

Chính sách xử lý lỗi khi tìm thấy định dạng không hợp lệ trong đầu vào.

Giá trị 'nghiêm ngặt' sẽ khiến thao tác tạo ra lỗi InvalidArgument trên bất kỳ định dạng đầu vào không hợp lệ nào. Giá trị 'thay thế' (mặc định) sẽ khiến thao tác thay thế mọi định dạng không hợp lệ trong đầu vào bằng điểm mã replacement_char . Giá trị 'bỏ qua' sẽ khiến thao tác bỏ qua mọi định dạng không hợp lệ trong đầu vào và không tạo ra ký tự đầu ra tương ứng.

Mặc định là "thay thế"

Thay thếĐiều khiểnKý tự

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

Có thay thế các ký tự điều khiển C0 (00-1F) bằng replacement_char hay không.

Mặc định là sai.

Mặc định là sai

Char thay thế

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

Điểm mã ký tự thay thế sẽ được sử dụng thay cho bất kỳ định dạng không hợp lệ nào trong dữ liệu đầu vào khi errors='replace' .

Bất kỳ điểm mã unicode hợp lệ nào cũng có thể được sử dụng. Giá trị mặc định là ký tự thay thế unicode mặc định là 0xFFFD hoặc U+65533.)

Lưu ý rằng đối với UTF-8, việc chuyển ký tự thay thế có thể biểu thị bằng 1 byte, chẳng hạn như '', sẽ duy trì sự liên kết chuỗi với nguồn vì các byte không hợp lệ sẽ được thay thế bằng thay thế 1 byte. Đối với UTF-16-BE và UTF-16-LE, bất kỳ ký tự thay thế 1 hoặc 2 byte nào sẽ duy trì căn chỉnh byte với nguồn.

Mặc định là 65533