Codifique un tensor de enteros en cadenas Unicode.
Devuelve un vector de cadenas, donde `output[i]` se construye codificando los puntos de código Unicode en `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.
---
Ejemplo:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
Clases anidadas
clase | UnicodeEncode.Opciones | Atributos opcionales para UnicodeEncode |
Métodos públicos
Salida <Cadena> | como salida () Devuelve el identificador simbólico de un tensor. |
estático <T extiende Número> UnicodeEncode | crear ( Ámbito de ámbito, Operando <Entero> valores de entrada, Operando <T> divisiones de entrada, Codificación de salida de cadena, Opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación UnicodeEncode. |
UnicodeEncode.Opciones estáticas | errores (errores de cadena) |
Salida <Cadena> | salida () El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados. |
UnicodeEncode.Opciones estáticas | replaceChar (Carácter de reemplazo largo) |
Métodos Heredados
Métodos públicos
Salida pública <String> asOutput ()
Devuelve el identificador simbólico de un tensor.
Las entradas de las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
UnicodeEncode estático público crear ( Ámbito de ámbito, Operando <Entero> valores de entrada, Operando <T> divisiones de entrada, Codificación de salida de cadena, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeEncode.
Parámetros
alcance | alcance actual |
---|---|
valores de entrada | Un tensor 1D que contiene los puntos de código Unicode que deben codificarse. |
divisiones de entrada | Un tensor 1D que especifica cómo los puntos de código Unicode deben dividirse en cadenas. En particular, `output[i]` se construye codificando los puntos de código en el segmento `input_values[input_splits[i]:input_splits[i+1]]`. |
salidaCodificación | Codificación Unicode de las cadenas de salida. Las codificaciones válidas son: `"UTF-8", "UTF-16-BE" y "UTF-32-BE"`. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de UnicodeEncode
Errores UnicodeEncode.Options públicos estáticos (errores de cadena)
Parámetros
errores | Política de manejo de errores cuando se encuentra un formato no válido en la entrada. El valor de 'estricto' hará que la operación produzca un error de argumento no válido en cualquier formato de entrada no válido. Un valor de 'reemplazar' (el valor predeterminado) hará que la operación reemplace cualquier formato no válido en la entrada con el punto de código `replacement_char`. Un valor de 'ignorar' hará que la operación omita cualquier formato no válido en la entrada y no produzca ningún carácter de salida correspondiente. |
---|
Salida pública <String> salida ()
El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados.
public static UnicodeEncode.Options replaceChar (Carácter de reemplazo largo)
Parámetros
reemplazoChar | El punto de código del carácter de reemplazo que se usará en lugar de cualquier formato no válido en la entrada cuando `errors='replace'`. Se puede utilizar cualquier punto de código Unicode válido. El valor predeterminado es que el carácter de reemplazo Unicode predeterminado es 0xFFFD (U+65533). |
---|