UnicodeEncode

classe finale pubblica UnicodeEncode

Codifica un tensore di int in stringhe Unicode.

Restituisce un vettore di stringhe, dove `output[i]` viene costruito codificando i punti di codice Unicode in `input_values[input_splits[i]:input_splits[i+1]]` utilizzando `output_encoding`.

---

Esempio:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classi nidificate

classe UnicodeEncode.Options Attributi facoltativi per UnicodeEncode

Costanti

Corda OP_NAME Il nome di questa operazione, come noto al motore principale di TensorFlow

Metodi pubblici

Uscita < TString >
comeuscita ()
Restituisce l'handle simbolico del tensore.
Codice Unicode statico
create ( Scope scope, Operando < TInt32 > inputValues, Operando <? extends TNumber > inputSplits, String outputEncoding, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione UnicodeEncode.
Statico UnicodeEncode.Options
errori (Errori di stringa)
Uscita < TString >
produzione ()
Il tensore 1-D delle stringhe codificate dai punti di codice Unicode forniti.
Statico UnicodeEncode.Options
sostituzioneChar (sostituzione lungaChar)

Metodi ereditati

Costanti

Stringa finale statica pubblica OP_NAME

Il nome di questa operazione, come noto al motore principale di TensorFlow

Valore costante: "UnicodeEncode"

Metodi pubblici

Output pubblico < TString > asOutput ()

Restituisce l'handle simbolico del tensore.

Gli input per le operazioni TensorFlow sono output di un'altra operazione TensorFlow. Questo metodo viene utilizzato per ottenere un handle simbolico che rappresenta il calcolo dell'input.

public static UnicodeEncode create ( Scope scope, Operand < TInt32 > inputValues, Operand <? extends TNumber > inputSplits, String outputEncoding, Options... options)

Metodo factory per creare una classe che racchiude una nuova operazione UnicodeEncode.

Parametri
ambito ambito attuale
inputValues Un tensore 1D contenente i punti di codice Unicode che dovrebbero essere codificati.
inputSplit Un tensore 1D che specifica come i punti di codice Unicode devono essere suddivisi in stringhe. In particolare, `output[i]` viene costruito codificando i codepoint nella slice `input_values[input_splits[i]:input_splits[i+1]]`.
outputEncoding Codifica Unicode delle stringhe di output. Le codifiche valide sono: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`.
opzioni trasporta valori di attributi opzionali
Ritorni
  • una nuova istanza di UnicodeEncode

errori pubblici statici UnicodeEncode.Options (errori di stringa)

Parametri
errori Criterio di gestione degli errori quando viene trovata una formattazione non valida nell'input. Il valore di 'strict' farà sì che l'operazione produca un errore InvalidArgument su qualsiasi formattazione di input non valida. Un valore "replace" (il valore predefinito) farà sì che l'operazione sostituisca qualsiasi formattazione non valida nell'input con il punto di codice "replacement_char". Un valore "ignore" farà sì che l'operazione salti qualsiasi formattazione non valida nell'input e non produca alcun carattere di output corrispondente.

output pubblico < TString > output ()

Il tensore 1-D delle stringhe codificate dai punti di codice Unicode forniti.

public static UnicodeEncode.Options replaceChar (Long replaceChar)

Parametri
sostituzioneChar Il punto di codice del carattere sostitutivo da utilizzare al posto di qualsiasi formattazione non valida nell'input quando `errors='replace'`. È possibile utilizzare qualsiasi punto di codice Unicode valido. Il valore predefinito è che il carattere sostitutivo Unicode predefinito è 0xFFFD (U+65533).