Encode tensor int menjadi string unicode.
Mengembalikan vektor string, di mana `output[i]` dibangun dengan mengkodekan titik kode Unicode dalam `input_values[input_splits[i]:input_splits[i+1]]` menggunakan `output_encoding`.
---
Contoh:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
Kelas Bersarang
kelas | UnicodeEncode.Options | Atribut opsional untuk UnicodeEncode |
Metode Publik
Output <String> | asOutput () Mengembalikan pegangan simbolis tensor. |
statis <T meluas Nomor> UnicodeEncode | membuat ( Lingkup lingkup, Operan <Integer> inputValues, Operan <T> inputSplits, String outputEncoding, Options ... pilihan) Metode pabrik untuk membuat kelas yang membungkus operasi UnicodeEncode baru. |
statis UnicodeEncode.Options | kesalahan (error String) |
Output <String> | Output () Tensor 1-D dari string yang dikodekan dari titik kode unicode yang disediakan. |
statis UnicodeEncode.Options | replacementChar (Long replacementChar) |
Metode yang Diwarisi
Metode Publik
publik Keluaran <String> asOutput ()
Mengembalikan pegangan simbolis tensor.
Input ke operasi TensorFlow adalah output dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.
public static UnicodeEncode membuat ( Scope lingkup, Operan <Integer> inputValues, Operan <T> inputSplits, String outputEncoding, Options ... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi UnicodeEncode baru.
Parameter
cakupan | lingkup saat ini |
---|---|
nilai masukan | Tensor 1D yang berisi titik kode unicode yang harus dikodekan. |
masukanSplit | Tensor 1D yang menentukan bagaimana titik kode unicode harus dipecah menjadi string. Secara khusus, `output[i]` dibangun dengan mengkodekan titik kode dalam irisan `input_values[input_splits[i]:input_splits[i+1]]`. |
keluaranEncoding | Pengkodean unicode dari string keluaran. Encoding yang valid adalah: `"UTF-8", "UTF-16-BE", dan "UTF-32-BE"`. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru UnicodeEncode
public static UnicodeEncode.Options kesalahan (error String)
Parameter
kesalahan | Kebijakan penanganan kesalahan ketika ada pemformatan yang tidak valid ditemukan di input. Nilai 'strict' akan menyebabkan operasi menghasilkan kesalahan InvalidArgument pada format input yang tidak valid. Nilai 'ganti' (default) akan menyebabkan operasi mengganti pemformatan yang tidak valid dalam input dengan titik kode `replacement_char`. Nilai 'abaikan' akan menyebabkan operasi melewatkan pemformatan yang tidak valid dalam input dan tidak menghasilkan karakter output yang sesuai. |
---|
publik Keluaran <String> Output ()
Tensor 1-D dari string yang dikodekan dari titik kode unicode yang disediakan.
public static UnicodeEncode.Options replacementChar (Long replacementChar)
Parameter
penggantiChar | Titik kode karakter pengganti yang akan digunakan sebagai pengganti pemformatan yang tidak valid dalam input saat `errors='replace'`. Setiap codepoint unicode yang valid dapat digunakan. Nilai default adalah karakter pengganti unicode default adalah 0xFFFD (U+65533). |
---|