aliran tensor:: operasi:: UnicodeTranskode:: Attr

#include <string_ops.h>

Penyetel atribut opsional untuk UnicodeTranscode .

Ringkasan

Atribut publik

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

Fungsi publik

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
Apakah akan mengganti karakter kontrol C0 (00-1F) dengan replacement_char .
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika errors='replace' .

Atribut publik

kesalahan_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

ganti_kontrol_karakter_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

penggantian_char_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

Fungsi publik

Kesalahan

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input.

Nilai 'strict' akan menyebabkan operasi menghasilkan kesalahan InvalidArgument pada format input apa pun yang tidak valid. Nilai 'ganti' (default) akan menyebabkan operasi mengganti format yang tidak valid pada input dengan titik kode replacement_char . Nilai 'abaikan' akan menyebabkan operasi melewatkan format apa pun yang tidak valid pada masukan dan tidak menghasilkan karakter keluaran yang sesuai.

Defaultnya adalah "ganti"

GantiControlCharacters

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

Apakah akan mengganti karakter kontrol C0 (00-1F) dengan replacement_char .

Standarnya salah.

Defaultnya salah

PenggantianChar

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika errors='replace' .

Titik kode unicode apa pun yang valid dapat digunakan. Nilai default karakter pengganti unicode default adalah 0xFFFD atau U+65533.)

Perhatikan bahwa untuk UTF-8, meneruskan karakter pengganti yang dapat diekspresikan dalam 1 byte, seperti ' ', akan mempertahankan penyelarasan string ke sumber karena byte yang tidak valid akan diganti dengan pengganti 1 byte. Untuk UTF-16-BE dan UTF-16-LE, karakter pengganti 1 atau 2 byte apa pun akan mempertahankan penyelarasan byte ke sumbernya.

Defaultnya adalah 65533