тензорный поток:: опс:: ИсправленоUnigramCandidateSampler:: Атрибуты
#include <candidate_sampling_ops.h>
Необязательные установщики атрибутов для FixUnigramCandidateSampler .
Краткое содержание
Публичные атрибуты | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
Общественные функции | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs Искажение используется для искажения распределения вероятностей униграмм. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids). |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs Второе семя, чтобы избежать столкновения семян. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова. |
Публичные атрибуты
искажение_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
семя2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
семя_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
осколок_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
униграммы_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
словарный_файл_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
Общественные функции
Искажение
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
Искажение используется для искажения распределения вероятностей униграмм.
Каждый вес сначала увеличивается до степени искажения, а затем добавляется к внутреннему распределению униграмм. В результате искажение = 1,0 дает регулярную выборку униграмм (как определено в файле словаря), а искажение = 0,0 дает равномерное распределение.
По умолчанию 1
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids).
Один из вариантов использования заключается в том, что в качестве идентификатора 0 используется специальный токен неизвестного слова. Вероятность выборки этих идентификаторов будет равна 0.
По умолчанию 0
Число осколков
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
Этот параметр (вместе с «shard») указывает количество разделов, которые используются в общих вычислениях.
По умолчанию 1
Семя
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом.
В противном случае он засеивается случайным семенем.
По умолчанию 0
Семя2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
Второе семя, чтобы избежать столкновения семян.
По умолчанию 0
Осколок
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
Этот параметр (вместе с «num_shards») указывает конкретный номер раздела операции сэмплера, когда используется секционирование.
По умолчанию 0
Униграммы
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке.
В эту операцию следует передать ровно один из vocab_file и униграмм.
По умолчанию []
ВокабФайл
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова.
Идентификаторы располагаются последовательно, начиная с num_reserved_ids. Ожидается, что последняя запись в каждой строке будет значением, соответствующим количеству или относительной вероятности. В эту операцию необходимо передать ровно один из vocab_file и униграмм.
По умолчанию ""