StringNGrams

classe finale pubblica StringNGrams

Crea ngram da dati di stringhe irregolari.

Questa operazione accetta un tensore irregolare con 1 dimensione irregolare contenente solo stringhe e genera un tensore irregolare con 1 dimensione irregolare contenente ngram di quella stringa, uniti lungo l'asse più interno.

Metodi pubblici

static <T estende Number> StringNGrams <T>
create ( Scope scope, Operand <String> data, Operand <T> dataSplits, String separator, List <Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preservShortSequences)
Metodo Factory per creare una classe che avvolge una nuova operazione StringNGrams.
Output <String>
ngram ()
Il tensore dei valori del tensore irregolare in ngram di output.
Uscita <T>
ngramsSplits ()
Il tensore delle divisioni del tensore irregolare in ngram di output.

Metodi ereditati

Metodi pubblici

public static StringNGrams <T> create ( Scope scope, Operand <String> data, Operand <T> dataSplits, String separator, List <Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preservShortSequences)

Metodo Factory per creare una classe che avvolge una nuova operazione StringNGrams.

Parametri
scopo ambito attuale
dati I valori tensore del tensore di stringa irregolare da cui ricavare ngram. Deve essere un tensore di stringa 1D.
dataSplits Il tensore delle divisioni del tensore delle stringhe irregolare da cui ricavare ngram.
separatore La stringa da aggiungere tra gli elementi del token. Usa "" per nessun separatore.
ngramWidths Le dimensioni degli ngram da creare.
leftPad La stringa da utilizzare per riempire il lato sinistro della sequenza ngram. Usato solo se pad_width! = 0.
rightPad La stringa da utilizzare per riempire il lato destro della sequenza ngram. Usato solo se pad_width! = 0.
padWidth Il numero di elementi di riempimento da aggiungere a ciascun lato di ogni sequenza. Nota che il riempimento non sarà mai maggiore di 'ngram_widths'-1 indipendentemente da questo valore. Se "pad_width = -1", aggiungi gli elementi "max (ngram_widths) -1".
ritorna
  • una nuova istanza di StringNGrams

output pubblico <String> ngram ()

I valori tensore del tensore irregolare di ngram di output.

output pubblico <T> ngramsSplits ()

Il tensore delle divisioni del tensore irregolare in ngram di output.