Создает метки для выборки кандидатов с изученным униграммным распределением.
См. объяснения выборки кандидатов и форматов данных на странице go/candidate-sampling.
Для каждой партии эта операция выбирает один набор выборочных меток-кандидатов.
Преимущества отбора кандидатов для каждой партии — это простота и возможность эффективного умножения плотных матриц. Недостаток заключается в том, что выбранные кандидаты должны выбираться независимо от контекста и истинных ярлыков.
Вложенные классы
сорт | LearnedUnigramCandidateSampler.Options | Дополнительные атрибуты для LearnedUnigramCandidateSampler |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
статический LearnedUnigramCandidateSampler | create ( Область действия, Операнд <TInt64> trueClasses, Long numTrue, Long numSampled, Boolean unique, Long rangeMax, Options... options) Фабричный метод для создания класса, обертывающего новую операцию LearnedUnigramCandidateSampler. |
Вывод < TInt64 > | выбранные кандидаты () Вектор длиной num_sampled, в котором каждый элемент является идентификатором выбранного кандидата. |
Вывод <TFloat32> | семпледожидаемый каунт () Вектор длиной num_sampled для каждого выбранного кандидата, представляющий ожидаемое количество раз, которое кандидат появится в пакете выбранных кандидатов. |
статический LearnedUnigramCandidateSampler.Options | семя (длинное семя) |
статический LearnedUnigramCandidateSampler.Options | семя2 (длинное семя2) |
Вывод <TFloat32> | trueExpectedCount () Матрица Batch_size * num_true, представляющая ожидаемое количество раз, которое каждый кандидат будет встречаться в пакете выбранных кандидатов. |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
public static LearnedUnigramCandidateSampler create (область действия , операнд <TInt64> trueClasses, Long numTrue, Long numSampled, Boolean unique, Long rangeMax, Options... options)
Фабричный метод для создания класса, обертывающего новую операцию LearnedUnigramCandidateSampler.
Параметры
объем | текущий объем |
---|---|
истинные классы | Матрица Batch_size * num_true, в которой каждая строка содержит идентификаторы целевых_классов num_true в соответствующей исходной метке. |
числоTrue | Количество истинных меток на контекст. |
numSampled | Количество кандидатов для случайной выборки. |
уникальный | Если значение unique истинно, мы выполняем выборку с отклонением, чтобы все выбранные кандидаты в пакете были уникальными. Это требует некоторого приближения для оценки вероятностей выборки после отклонения. |
диапазонМакс. | Сэмплер будет выбирать целые числа из интервала [0, range_max). |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр LearnedUnigramCandidateSampler
публичный вывод <TInt64> sampledCandidates ()
Вектор длиной num_sampled, в котором каждый элемент является идентификатором выбранного кандидата.
публичный вывод <TFloat32> sampledExpectedCount ()
Вектор длиной num_sampled для каждого выбранного кандидата, представляющий ожидаемое количество раз, которое кандидат появится в пакете выбранных кандидатов. Если unique=true, то это вероятность.
общедоступное статическое семя LearnedUnigramCandidateSampler.Options (длинное семя)
Параметры
семя | Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом. В противном случае он засеивается случайным семенем. |
---|
общедоступный статический LearnedUnigramCandidateSampler.Options семя2 (длинное семя2)
Параметры
семя2 | Второе семя, чтобы избежать столкновения семян. |
---|
публичный вывод <TFloat32> trueExpectedCount ()
Матрица Batch_size * num_true, представляющая ожидаемое количество раз, которое каждый кандидат будет встречаться в пакете выбранных кандидатов. Если unique=true, то это вероятность.