Cria ngrams de dados de string irregulares.
Este op aceita um tensor irregular com 1 dimensão irregular contendo apenas strings e gera um tensor irregular com 1 dimensão irregular contendo ngrams dessa string, unidos ao longo do eixo mais interno.
Métodos públicos
estático <T estende o número> StringNGrams <T> | |
Saída <String> | nggramas () O tensor de valores do tensor irregular de ngrams de saída. |
Saída <T> | ngramsSplits () O tensor de divisões do tensor irregular de ngrams de saída. |
Métodos Herdados
Métodos públicos
public static StringNGrams <T> create ( Escopo do escopo, Operando <String> dados, Operando <T> dataSplits, Separador de strings, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences)
Método de fábrica para criar uma classe envolvendo uma nova operação StringNGrams.
Parâmetros
alcance | escopo atual |
---|---|
dados | O tensor de valores do tensor de string irregular para fazer ngrams. Deve ser um tensor de string 1D. |
DataSplits | O tensor de divisão do tensor de corda irregular para fazer ngrams. |
separador | A string a ser acrescentada entre os elementos do token. Use "" para nenhum separador. |
ngramWidths | Os tamanhos dos ngrams a serem criados. |
teclado esquerdo | A string a ser usada para preencher o lado esquerdo da sequência ngram. Usado apenas se pad_width != 0. |
teclado direito | A string a ser usada para preencher o lado direito da sequência ngram. Usado apenas se pad_width != 0. |
padWidth | O número de elementos de preenchimento a serem adicionados a cada lado de cada sequência. Observe que o preenchimento nunca será maior que 'ngram_widths'-1, independentemente desse valor. Se `pad_width=-1`, adicione os elementos `max(ngram_widths)-1`. |
Devoluções
- uma nova instância de StringNGrams