Создает ngrams из неровных строковых данных.
Эта операция принимает неровный тензор с 1 неровным измерением, содержащим только строки, и выводит неровный тензор с 1 неровным измерением, содержащим nграммы этой строки, соединенные по самой внутренней оси.
Публичные методы
static <T расширяет число> StringNGrams <T> | |
Вывод <Строка> | нграмм () Тензор значений выходного рваного тензора ngrams. |
Выход <Т> | нграммСплитс () Тензор разделения выходного рваного тензора ngrams. |
Унаследованные методы
Публичные методы
public static StringNGrams <T> create (область области действия , данные операнда <String>, операнд <T> dataSplits, разделитель строк, List<Long> ngramWidths, String leftPad, String rightPad, LongpadWidth, логическое значение saveShortSequences)
Фабричный метод для создания класса, обертывающего новую операцию StringNGrams.
Параметры
объем | текущий объем |
---|---|
данные | Тензор значений тензора неровных строк, из которого нужно составить ngrams. Должен быть одномерным струнным тензором. |
разделение данных | Тензор разделения тензора рваной строки, из которого создаются ngrams. |
разделитель | Строка, добавляемая между элементами токена. Используйте "" без разделителя. |
ngramWidths | Размеры создаваемых ngrams. |
левыйPad | Строка, используемая для заполнения левой части последовательности ngram. Используется только в том случае, если Pad_width != 0. |
правыйPad | Строка, используемая для заполнения правой части последовательности ngram. Используется только в том случае, если Pad_width != 0. |
ширина площадки | Количество элементов заполнения, добавляемых к каждой стороне каждой последовательности. Обратите внимание, что заполнение никогда не будет больше, чем «ngram_widths»-1, независимо от этого значения. Если `pad_width=-1`, добавьте элементы `max(ngram_widths)-1`. |
Возврат
- новый экземпляр StringNGrams