Enkode tensor int menjadi string unicode.
Mengembalikan vektor string, di mana `output[i]` dibuat dengan mengkodekan titik kode Unicode di `input_values[input_splits[i]:input_splits[i+1]]` menggunakan `output_encoding`.
---
Contoh:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
Kelas Bersarang
kelas | UnicodeEncode.Opsi | Atribut opsional untuk UnicodeEncode |
Metode Publik
Keluaran <String> | sebagai Keluaran () Mengembalikan pegangan simbolik tensor. |
statis <T memperluas Nomor> UnicodeEncode | |
UnicodeEncode.Options statis | kesalahan (kesalahan string) |
Keluaran <String> | keluaran () Tensor 1-D string yang dikodekan dari titik kode unicode yang disediakan. |
UnicodeEncode.Options statis | replacementChar (Char pengganti panjang) |
Metode Warisan
Metode Publik
Keluaran publik <String> sebagaiOutput ()
Mengembalikan pegangan simbolik tensor.
Masukan ke operasi TensorFlow adalah keluaran dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.
pembuatan UnicodeEncode statis publik ( Lingkup cakupan , Operan <Integer> inputValues, Operan <T> inputSplits, String outputEncoding, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi UnicodeEncode baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
nilai masukan | Tensor 1D berisi titik kode unicode yang harus dikodekan. |
masukanSplit | Tensor 1D yang menentukan bagaimana titik kode unicode harus dipecah menjadi string. Secara khusus, `output[i]` dibuat dengan mengkodekan titik kode dalam irisan `input_values[input_splits[i]:input_splits[i+1]]`. |
pengkodean keluaran | Pengkodean unicode dari string keluaran. Pengkodean yang valid adalah: `"UTF-8", "UTF-16-BE", dan "UTF-32-BE"`. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru UnicodeEncode
kesalahan UnicodeEncode.Options statis publik (kesalahan string)
Parameter
kesalahan | Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input. Nilai 'strict' akan menyebabkan operasi menghasilkan kesalahan InvalidArgument pada format input apa pun yang tidak valid. Nilai 'ganti' (default) akan menyebabkan operasi mengganti format apa pun yang tidak valid dalam input dengan titik kode `replacement_char`. Nilai 'abaikan' akan menyebabkan operasi melewatkan format masukan apa pun yang tidak valid dan tidak menghasilkan karakter keluaran yang sesuai. |
---|
Keluaran publik <String> keluaran ()
Tensor 1-D string yang dikodekan dari titik kode unicode yang disediakan.
UnicodeEncode statis publik.Options replacementChar (Char pengganti panjang)
Parameter
penggantianChar | Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika `errors='replace'`. Titik kode unicode apa pun yang valid dapat digunakan. Nilai default karakter pengganti unicode default adalah 0xFFFD (U+65533). |
---|