Crea ngram da dati di stringhe irregolari.
Questa operazione accetta un tensore irregolare con 1 dimensione irregolare contenente solo stringhe e genera un tensore irregolare con 1 dimensione irregolare contenente ngram di quella stringa, uniti lungo l'asse più interno.
Metodi pubblici
static <T estende Number> StringNGrams <T> | |
Output <String> | ngram () Il tensore dei valori del tensore irregolare in ngram di output. |
Uscita <T> | ngramsSplits () Il tensore delle divisioni del tensore irregolare in ngram di output. |
Metodi ereditati
Metodi pubblici
public static StringNGrams <T> create ( Scope scope, Operand <String> data, Operand <T> dataSplits, String separator, List <Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preservShortSequences)
Metodo Factory per creare una classe che avvolge una nuova operazione StringNGrams.
Parametri
scopo | ambito attuale |
---|---|
dati | I valori tensore del tensore di stringa irregolare da cui ricavare ngram. Deve essere un tensore di stringa 1D. |
dataSplits | Il tensore delle divisioni del tensore delle stringhe irregolare da cui ricavare ngram. |
separatore | La stringa da aggiungere tra gli elementi del token. Usa "" per nessun separatore. |
ngramWidths | Le dimensioni degli ngram da creare. |
leftPad | La stringa da utilizzare per riempire il lato sinistro della sequenza ngram. Usato solo se pad_width! = 0. |
rightPad | La stringa da utilizzare per riempire il lato destro della sequenza ngram. Usato solo se pad_width! = 0. |
padWidth | Il numero di elementi di riempimento da aggiungere a ciascun lato di ogni sequenza. Nota che il riempimento non sarà mai maggiore di 'ngram_widths'-1 indipendentemente da questo valore. Se "pad_width = -1", aggiungi gli elementi "max (ngram_widths) -1". |
ritorna
- una nuova istanza di StringNGrams
output pubblico <T> ngramsSplits ()
Il tensore delle divisioni del tensore irregolare in ngram di output.