השתתפו בסימפוזיון נשים ב-ML ב-7 בדצמבר הירשמו עכשיו

זרימת טנסור :: אופ :: FixedUnigramCandidateSampler :: עו"ד

#include <candidate_sampling_ops.h>

קובעי תכונות אופציונליים עבור FixedUnigramCandidateSampler .

סיכום

תכונות ציבוריות

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

פונקציות ציבוריות

Distortion (float x)
TF_MUST_USE_RESULT Attrs
העיוות משמש להטיית התפלגות ההסתברות של יוניגרם.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
באופן אופציונלי ניתן להוסיף מספר מזהים שמורים בטווח [0, ..., מספר_מרות_מיידים) על ידי המשתמשים.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
ניתן להשתמש בדגימה לדגימה מקבוצת משנה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקבילות.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
אם זרעים או זרעים 2 מוגדרים כלא אפסיים, מחולל המספרים האקראיים נזרע על ידי הזרע הנתון.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
זרע שני למניעת התנגשות זרעים.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
ניתן להשתמש בדגימה לדגימה מקבוצת משנה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקבילות.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
רשימה של ספירות או הסתברויות של יוניגרם, אחת לכל מזהה בסדר רציף.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) תואמת לזהות מילה חוקית.

תכונות ציבוריות

עיוות_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

מספר_מרות_מוספים_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

מספר_רסיסים_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

seed2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

זֶרַע_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

חֶרֶס_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigrams_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

קובץ vocab_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

פונקציות ציבוריות

עיוות

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

העיוות משמש להטיית התפלגות ההסתברות של יוניגרם.

כל משקל מועלה תחילה לעוצמת העיוות לפני שהוא מוסיף להתפלגות האוניגרם הפנימית. כתוצאה מכך, עיוות = 1.0 נותן דגימת Unigram רגילה (כהגדרת קובץ vocab), ועיוות = 0.0 נותן התפלגות אחידה.

ברירת המחדל היא 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

באופן אופציונלי ניתן להוסיף מספר מזהים שמורים בטווח [0, ..., מספר_מרות_מיידים) על ידי המשתמשים.

מקרה שימוש אחד הוא שאסימון מילה לא ידוע מיוחד משמש כמזהה 0. מזהים אלה יהיו בעלי הסתברות דגימה של 0.

ברירת המחדל היא 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

ניתן להשתמש בדגימה לדגימה מקבוצת משנה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקבילות.

פרמטר זה (יחד עם 'שבר') מציין את מספר המחיצות המשמשות בחישוב הכולל.

ברירת המחדל היא 1

זֶרַע

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

אם זרע או זרע 2 מוגדרים כלא אפסיים, מחולל המספרים האקראיים נזרע על ידי הזרע הנתון.

אחרת, הוא נזרע על ידי זרע אקראי.

ברירת המחדל היא 0

זרע 2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

זרע שני למניעת התנגשות זרעים.

ברירת המחדל היא 0

חֶרֶס

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

ניתן להשתמש בדגימה לדגימה מקבוצת משנה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקבילות.

פרמטר זה (יחד עם 'num_shards') מציין את מספר המחיצה המסוים של sampler op כאשר משתמשים במחיצות.

ברירת המחדל היא 0

יוניגרמים

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

רשימה של ספירות או הסתברויות של יוניגרם, אחת לכל מזהה בסדר רציף.

בדיוק אחד מבין קבצי vocab_en unigrams צריך לעבור לאופציה זו.

ברירת המחדל היא []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) תואמת לזהות מילה חוקית.

המזהים הם בסדר רציף, החל מ- num_reserved_ids. הערך האחרון בכל שורה צפוי להיות ערך המתאים לספירה או להסתברות יחסית. בדיוק אחד מ- vocab_file ו- unigrams צריך לעבור לאופציה זו.

ברירת המחדל היא ""