Tensorflow :: ops :: FixedUnigramCandidateSampler :: Attrs

#include <candidate_sampling_ops.h>

Optionale Attributsetzer für FixedUnigramCandidateSampler .

Zusammenfassung

Öffentliche Attribute

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Öffentliche Funktionen

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Die Verzerrung wird verwendet, um die Unigrammwahrscheinlichkeitsverteilung zu verzerren.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Optional können einige reservierte IDs von den Benutzern im Bereich [0, ..., num_reserved_ids] hinzugefügt werden.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Ein Sampler kann verwendet werden, um aus einer Teilmenge des ursprünglichen Bereichs abzutasten, um die gesamte Berechnung durch Parallelität zu beschleunigen.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Wenn entweder seed oder seed2 auf ungleich Null gesetzt ist, wird der Zufallszahlengenerator durch den angegebenen Startwert gesetzt.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Ein zweiter Samen, um eine Samenkollision zu vermeiden.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Ein Sampler kann verwendet werden, um aus einer Teilmenge des ursprünglichen Bereichs abzutasten, um die gesamte Berechnung durch Parallelität zu beschleunigen.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Eine Liste von Unigrammzahlen oder -wahrscheinlichkeiten, eine pro ID in sequentieller Reihenfolge.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Jede gültige Zeile in dieser Datei (die ein CSV-ähnliches Format haben sollte) entspricht einer gültigen Wort-ID.

Öffentliche Attribute

Verzerrung_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

seed2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

Samen_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

Scherbe_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigrams_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Öffentliche Funktionen

Verzerrung

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Die Verzerrung wird verwendet, um die Unigrammwahrscheinlichkeitsverteilung zu verzerren.

Jedes Gewicht wird zuerst auf die Stärke der Verzerrung angehoben, bevor es zur internen Unigrammverteilung hinzugefügt wird. Infolgedessen ergibt Verzerrung = 1,0 eine regelmäßige Unigrammabtastung (wie in der Vokabeldatei definiert), und Verzerrung = 0,0 ergibt eine gleichmäßige Verteilung.

Der Standardwert ist 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Optional können einige reservierte IDs von den Benutzern im Bereich [0, ..., num_reserved_ids] hinzugefügt werden.

Ein Anwendungsfall besteht darin, dass ein spezielles unbekanntes Wort-Token als ID 0 verwendet wird. Diese IDs haben eine Abtastwahrscheinlichkeit von 0.

Der Standardwert ist 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Ein Sampler kann verwendet werden, um aus einer Teilmenge des ursprünglichen Bereichs abzutasten, um die gesamte Berechnung durch Parallelität zu beschleunigen.

Dieser Parameter (zusammen mit 'shard') gibt die Anzahl der Partitionen an, die für die Gesamtberechnung verwendet werden.

Der Standardwert ist 1

Samen

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Wenn entweder seed oder seed2 auf ungleich Null gesetzt ist, wird der Zufallszahlengenerator durch den angegebenen Startwert gesetzt.

Andernfalls wird es durch einen zufälligen Startwert ausgesät.

Der Standardwert ist 0

Seed2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Ein zweiter Samen, um eine Samenkollision zu vermeiden.

Der Standardwert ist 0

Scherbe

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Ein Sampler kann verwendet werden, um aus einer Teilmenge des ursprünglichen Bereichs abzutasten, um die gesamte Berechnung durch Parallelität zu beschleunigen.

Dieser Parameter (zusammen mit 'num_shards') gibt die bestimmte Partitionsnummer eines Sampler-Betriebs an, wenn die Partitionierung verwendet wird.

Der Standardwert ist 0

Unigramme

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Eine Liste von Unigrammzahlen oder -wahrscheinlichkeiten, eine pro ID in sequentieller Reihenfolge.

Genau eines von vocab_file und Unigrammen sollte an diese Operation übergeben werden.

Der Standardwert ist []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Jede gültige Zeile in dieser Datei (die ein CSV-ähnliches Format haben sollte) entspricht einer gültigen Wort-ID.

IDs sind in sequenzieller Reihenfolge, beginnend mit num_reserved_ids. Es wird erwartet, dass der letzte Eintrag in jeder Zeile ein Wert ist, der der Anzahl oder relativen Wahrscheinlichkeit entspricht. Genau eines von vocab_file und Unigrammen muss an diese Operation übergeben werden.

Der Standardwert ist ""