Эта страница переведена с помощью Cloud Translation API.

тензорный поток:: опс:: ИсправленоUnigramCandidateSampler:: Атрибуты

#include <candidate_sampling_ops.h>

Необязательные установщики атрибутов для FixUnigramCandidateSampler .

Краткое содержание

Публичные атрибуты
`distortion_ = 1.0f`	`float`
`num_reserved_ids_ = 0`	`int64`
`num_shards_ = 1`	`int64`
`seed2_ = 0`	`int64`
`seed_ = 0`	`int64`
`shard_ = 0`	`int64`
`unigrams_ = {}`	`gtl::ArraySlice< float >`
`vocab_file_ = ""`	`StringPiece`

Общественные функции
`Distortion (float x)`	`TF_MUST_USE_RESULT Attrs` Искажение используется для искажения распределения вероятностей униграмм.
`NumReservedIds (int64 x)`	`TF_MUST_USE_RESULT Attrs` При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids).
`NumShards (int64 x)`	`TF_MUST_USE_RESULT Attrs` Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
`Seed (int64 x)`	`TF_MUST_USE_RESULT Attrs` Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом.
`Seed2 (int64 x)`	`TF_MUST_USE_RESULT Attrs` Второе семя, чтобы избежать столкновения семян.
`Shard (int64 x)`	`TF_MUST_USE_RESULT Attrs` Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.
`Unigrams (const gtl::ArraySlice< float > & x)`	`TF_MUST_USE_RESULT Attrs` Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке.
`VocabFile (StringPiece x)`	`TF_MUST_USE_RESULT Attrs` Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова.

Публичные атрибуты

искажение_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

семя2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

семя_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

осколок_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

униграммы_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

словарный_файл_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Общественные функции

Искажение

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Искажение используется для искажения распределения вероятностей униграмм.

Каждый вес сначала увеличивается до степени искажения, а затем добавляется к внутреннему распределению униграмм. В результате искажение = 1,0 дает регулярную выборку униграмм (как определено в файле словаря), а искажение = 0,0 дает равномерное распределение.

По умолчанию 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids).

Один из вариантов использования заключается в том, что в качестве идентификатора 0 используется специальный токен неизвестного слова. Вероятность выборки этих идентификаторов будет равна 0.

По умолчанию 0

Число осколков

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма.

Этот параметр (вместе с «shard») указывает количество разделов, которые используются в общих вычислениях.

По умолчанию 1

Семя

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом.

В противном случае он засеивается случайным семенем.

По умолчанию 0

Семя2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Второе семя, чтобы избежать столкновения семян.

По умолчанию 0

Осколок

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Этот параметр (вместе с «num_shards») указывает конкретный номер раздела операции сэмплера, когда используется секционирование.

По умолчанию 0

Униграммы

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Список количества или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке.

В эту операцию следует передать ровно один из vocab_file и униграмм.

По умолчанию []

ВокабФайл

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова.

Идентификаторы располагаются последовательно, начиная с num_reserved_ids. Ожидается, что последняя запись в каждой строке будет значением, соответствующим количеству или относительной вероятности. В эту операцию необходимо передать ровно один из vocab_file и униграмм.

По умолчанию ""