тензорный поток:: опс:: ИсправленоUnigramCandidateSampler:: Атрибуты

#include <candidate_sampling_ops.h>

Необязательные установщики атрибутов для FixUnigramCandidateSampler .

Краткое содержание

Публичные атрибуты

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Общественные функции

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Искажение используется для искажения распределения вероятностей униграмм.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids).
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Второе семя, чтобы избежать столкновения семян.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова.

Публичные атрибуты

искажение_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

семя2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

семя_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

осколок_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

униграммы_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

словарный_файл_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Общественные функции

Искажение

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Искажение используется для искажения распределения вероятностей униграмм.

Каждый вес сначала увеличивается до степени искажения, а затем добавляется к внутреннему распределению униграмм. В результате искажение = 1,0 дает регулярную выборку униграмм (как определено в файле словаря), а искажение = 0,0 дает равномерное распределение.

По умолчанию 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids).

Один из вариантов использования заключается в том, что в качестве идентификатора 0 используется специальный токен неизвестного слова. Вероятность выборки этих идентификаторов будет равна 0.

По умолчанию 0

Число осколков

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.

Этот параметр (вместе с «shard») указывает количество разделов, которые используются в общих вычислениях.

По умолчанию 1

Семя

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом.

В противном случае он засеивается случайным семенем.

По умолчанию 0

Семя2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Второе семя, чтобы избежать столкновения семян.

По умолчанию 0

Осколок

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.

Этот параметр (вместе с «num_shards») указывает конкретный номер раздела операции сэмплера, когда используется секционирование.

По умолчанию 0

Униграммы

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке.

В эту операцию следует передать ровно один из vocab_file и униграмм.

По умолчанию []

ВокабФайл

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова.

Идентификаторы располагаются последовательно, начиная с num_reserved_ids. Ожидается, что последняя запись в каждой строке будет значением, соответствующим количеству или относительной вероятности. В эту операцию необходимо передать ровно один из vocab_file и униграмм.

По умолчанию ""