Codice Unicode

classe finale pubblica UnicodeEncode

Codifica un tensore di int in stringhe Unicode.

Restituisce un vettore di stringhe, dove `output[i]` viene costruito codificando i punti di codice Unicode in `input_values[input_splits[i]:input_splits[i+1]]` utilizzando `output_encoding`.

---

Esempio:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classi nidificate

classe UnicodeEncode.Options Attributi facoltativi per UnicodeEncode

Metodi pubblici

Uscita <Stringa>
comeuscita ()
Restituisce la maniglia simbolica di un tensore.
static <T estende il numero> UnicodeEncode
create ( ambito ambito , operando <Integer> inputValues, operando <T> inputSplits, stringa outputEncoding, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione UnicodeEncode.
Statico UnicodeEncode.Options
errori (Errori di stringa)
Uscita <Stringa>
produzione ()
Il tensore 1-D delle stringhe codificate dai punti di codice Unicode forniti.
Statico UnicodeEncode.Options
sostituzioneChar (sostituzione lungaChar)

Metodi ereditati

Metodi pubblici

output pubblico <String> asOutput ()

Restituisce la maniglia simbolica di un tensore.

Gli input per le operazioni TensorFlow sono output di un'altra operazione TensorFlow. Questo metodo viene utilizzato per ottenere un handle simbolico che rappresenta il calcolo dell'input.

public static UnicodeEncode create ( Scope scope, Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Opzioni... opzioni)

Metodo factory per creare una classe che racchiude una nuova operazione UnicodeEncode.

Parametri
scopo ambito attuale
inputValues Un tensore 1D contenente i punti di codice Unicode che dovrebbero essere codificati.
inputSplit Un tensore 1D che specifica come i punti di codice Unicode devono essere suddivisi in stringhe. In particolare, `output[i]` viene costruito codificando i codepoint nella slice `input_values[input_splits[i]:input_splits[i+1]]`.
outputEncoding Codifica Unicode delle stringhe di output. Le codifiche valide sono: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di UnicodeEncode

errori pubblici statici UnicodeEncode.Options (errori di stringa)

Parametri
errori Criterio di gestione degli errori quando viene trovata una formattazione non valida nell'input. Il valore di 'strict' farà sì che l'operazione produca un errore InvalidArgument su qualsiasi formattazione di input non valida. Un valore "replace" (il valore predefinito) farà sì che l'operazione sostituisca qualsiasi formattazione non valida nell'input con il punto di codice "replacement_char". Un valore "ignore" farà sì che l'operazione salti qualsiasi formattazione non valida nell'input e non produca alcun carattere di output corrispondente.

output pubblico <String> output ()

Il tensore 1-D delle stringhe codificate dai punti di codice Unicode forniti.

public static UnicodeEncode.Options replaceChar (Long replaceChar)

Parametri
sostituzioneChar Il punto di codice del carattere sostitutivo da utilizzare al posto di qualsiasi formattazione non valida nell'input quando `errors='replace'`. È possibile utilizzare qualsiasi punto di codice Unicode valido. Il valore predefinito è che il carattere sostitutivo Unicode predefinito è 0xFFFD (U+65533).