общедоступный статический класс FixUnigramCandidateSampler.Options
Дополнительные атрибуты для FixedUnigramCandidateSampler
Публичные методы
ИсправленоUnigramCandidateSampler.Options | искажение (плавающее искажение) |
ИсправленоUnigramCandidateSampler.Options | numReservedIds (длинное значение numReservedIds) |
ИсправленоUnigramCandidateSampler.Options | numShards (длинное число осколков) |
ИсправленоUnigramCandidateSampler.Options | семя (длинное семя) |
ИсправленоUnigramCandidateSampler.Options | семя2 (длинное семя2) |
ИсправленоUnigramCandidateSampler.Options | осколок (длинный осколок) |
ИсправленоUnigramCandidateSampler.Options | униграммы (List<Float> униграммы) |
ИсправленоUnigramCandidateSampler.Options | vocabFile (Строка vocabFile) |
Унаследованные методы
Публичные методы
public FixUnigramCandidateSampler.Options искажение (Искажение с плавающей запятой)
Параметры
искажение | Искажение используется для искажения распределения вероятностей униграмм. Каждый вес сначала увеличивается до степени искажения, а затем добавляется к внутреннему распределению униграмм. В результате искажение = 1,0 дает регулярную выборку униграмм (как определено в файле словаря), а искажение = 0,0 дает равномерное распределение. |
---|
publicFixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)
Параметры
numReservedIds | При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids). Один из вариантов использования заключается в том, что в качестве идентификатора 0 используется специальный токен неизвестного слова. Вероятность выборки этих идентификаторов будет равна 0. |
---|
publicFixedUnigramCandidateSampler.Options numShards (Long numShards)
Параметры
число осколков | Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. Этот параметр (вместе с «shard») указывает количество разделов, которые используются в общих вычислениях. |
---|
общедоступное семя FixUnigramCandidateSampler.Options (длинное семя)
Параметры
семя | Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом. В противном случае он засеивается случайным семенем. |
---|
общедоступный фиксированныйUnigramCandidateSampler.Options семя2 (длинное семя2)
Параметры
семя2 | Второе семя, чтобы избежать столкновения семян. |
---|
Осколок publicFixedUnigramCandidateSampler.Options (длинный осколок)
Параметры
осколок | Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. Этот параметр (вместе с «num_shards») указывает конкретный номер раздела операции сэмплера, когда используется секционирование. |
---|
общедоступные униграммы FixUnigramCandidateSampler.Options (униграммы List<Float>)
Параметры
униграммы | Список чисел или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке. В эту операцию следует передать ровно один из vocab_file и униграмм. |
---|
общедоступный фиксированныйUnigramCandidateSampler.Options vocabFile (String vocabFile)
Параметры
vocabFile | Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова. Идентификаторы располагаются последовательно, начиная с num_reserved_ids. Ожидается, что последняя запись в каждой строке будет значением, соответствующим количеству или относительной вероятности. В эту операцию необходимо передать ровно один из vocab_file и униграмм. |
---|