UnicodeEncode

UnicodeEncode kelas akhir publik

Enkode tensor int menjadi string unicode.

Mengembalikan vektor string, di mana `output[i]` dibuat dengan mengkodekan titik kode Unicode di `input_values[input_splits[i]:input_splits[i+1]]` menggunakan `output_encoding`.

---

Contoh:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Kelas Bersarang

kelas UnicodeEncode.Opsi Atribut opsional untuk UnicodeEncode

Konstanta

Rangkaian OP_NAME Nama operasi ini dikenal dengan mesin inti TensorFlow

Metode Publik

Keluaran <TString>
sebagai Keluaran ()
Mengembalikan pegangan simbolis tensor.
UnicodeEncode statis
buat ( Lingkup cakupan , Operan < TInt32 > inputValues, Operan <? extends TNumber > inputSplits, String outputEncoding, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi UnicodeEncode baru.
UnicodeEncode.Options statis
kesalahan (kesalahan string)
Keluaran <TString>
keluaran ()
Tensor 1-D string yang dikodekan dari titik kode unicode yang disediakan.
UnicodeEncode.Options statis
replacementChar (Char pengganti panjang)

Metode Warisan

Konstanta

String akhir statis publik OP_NAME

Nama operasi ini dikenal dengan mesin inti TensorFlow

Nilai Konstan: "UnicodeEncode"

Metode Publik

Keluaran publik < TString > asOutput ()

Mengembalikan pegangan simbolis tensor.

Masukan ke operasi TensorFlow adalah keluaran dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.

UnicodeEncode statis publik buat ( Lingkup cakupan , Operan < TInt32 > inputValues, Operan <? extends TNumber > inputSplits, String outputEncoding, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi UnicodeEncode baru.

Parameter
cakupan ruang lingkup saat ini
nilai masukan Tensor 1D berisi titik kode unicode yang harus dikodekan.
masukanSplit Tensor 1D yang menentukan bagaimana titik kode unicode harus dipecah menjadi string. Secara khusus, `output[i]` dibuat dengan mengkodekan titik kode dalam irisan `input_values[input_splits[i]:input_splits[i+1]]`.
pengkodean keluaran Pengkodean unicode dari string keluaran. Pengkodean yang valid adalah: `"UTF-8", "UTF-16-BE", dan "UTF-32-BE"`.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru UnicodeEncode

kesalahan UnicodeEncode.Options statis publik (kesalahan string)

Parameter
kesalahan Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input. Nilai 'strict' akan menyebabkan operasi menghasilkan kesalahan InvalidArgument pada format input apa pun yang tidak valid. Nilai 'ganti' (default) akan menyebabkan operasi mengganti format apa pun yang tidak valid dalam input dengan titik kode `replacement_char`. Nilai 'abaikan' akan menyebabkan operasi melewatkan format masukan yang tidak valid dan tidak menghasilkan karakter keluaran yang sesuai.

Keluaran publik < TString > keluaran ()

Tensor 1-D string yang dikodekan dari titik kode unicode yang disediakan.

UnicodeEncode statis publik.Options replacementChar (Char pengganti panjang)

Parameter
penggantianChar Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika `errors='replace'`. Titik kode unicode apa pun yang valid dapat digunakan. Nilai default karakter pengganti unicode default adalah 0xFFFD (U+65533).