جریان تنسور:: عملیات:: FixedUnigramCandidateSampler:: Attrs
#include <candidate_sampling_ops.h>
تنظیم کننده های ویژگی اختیاری برای FixedUnigramCandidateSampler .
خلاصه
صفات عمومی | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
توابع عمومی | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs اعوجاج برای انحراف توزیع احتمال یک گرم استفاده می شود. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs به صورت اختیاری، برخی از شناسه های رزرو شده را می توان در محدوده [0، ...، num_reserved_ids) توسط کاربران اضافه کرد. |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs نمونهبردار را میتوان برای نمونهبرداری از زیر مجموعهای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازیسازی استفاده کرد. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs اگر seed یا seed2 غیر صفر باشد، مولد اعداد تصادفی توسط دانه داده شده بذر می شود. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs دانه دوم برای جلوگیری از برخورد دانه. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs نمونهبردار را میتوان برای نمونهبرداری از زیر مجموعهای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازیسازی استفاده کرد. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs فهرستی از تعداد یا احتمالات یونیگرام، یکی در هر شناسه به ترتیب متوالی. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs هر خط معتبر در این فایل (که باید قالبی شبیه CSV داشته باشد) با شناسه کلمه معتبر مطابقت دارد. |
صفات عمومی
تحریف_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
دانه 2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
دانه_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
خرده_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
یونیگرم_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
vocab_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
توابع عمومی
تحریف
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
اعوجاج برای انحراف توزیع احتمال یک گرم استفاده می شود.
هر وزن ابتدا قبل از اضافه شدن به توزیع یونیگرم داخلی به قدرت اعوجاج افزایش می یابد. در نتیجه، اعوجاج = 1.0 نمونه گیری unigram منظم (همانطور که توسط فایل vocab تعریف شده است) و اعوجاج = 0.0 توزیع یکنواختی را ارائه می دهد.
پیش فرض 1 است
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
به صورت اختیاری، برخی از شناسه های رزرو شده را می توان در محدوده [0، ...، num_reserved_ids) توسط کاربران اضافه کرد.
یک مورد استفاده این است که یک رمز کلمه ناشناخته خاص به عنوان ID 0 استفاده می شود. این شناسه ها احتمال نمونه برداری 0 خواهند داشت.
پیش فرض 0 است
NumShards
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
نمونهبردار را میتوان برای نمونهبرداری از زیر مجموعهای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازیسازی استفاده کرد.
این پارامتر (همراه با 'shard') تعداد پارتیشن هایی را نشان می دهد که در محاسبات کلی استفاده می شوند.
پیش فرض 1 است
بذر
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
اگر seed یا seed2 غیر صفر باشد، مولد اعداد تصادفی توسط دانه داده شده بذر می شود.
در غیر این صورت، توسط یک بذر تصادفی بذر می شود.
پیش فرض 0 است
دانه 2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
دانه دوم برای جلوگیری از برخورد دانه.
پیش فرض 0 است
شارد
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
نمونهبردار را میتوان برای نمونهبرداری از زیر مجموعهای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازیسازی استفاده کرد.
این پارامتر (همراه با 'num_shards') شماره پارتیشن خاص یک نمونه کار را در هنگام استفاده از پارتیشن بندی نشان می دهد.
پیش فرض 0 است
Unigrams
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
فهرستی از تعداد یا احتمالات یونیگرام، یکی در هر شناسه به ترتیب متوالی.
دقیقاً یکی از vocab_file و unigram ها باید به این گزینه منتقل شود.
پیشفرض به []
VocabFile
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
هر خط معتبر در این فایل (که باید قالبی شبیه CSV داشته باشد) با شناسه کلمه معتبر مطابقت دارد.
شناسه ها به ترتیب ترتیب هستند و از num_reserved_ids شروع می شوند. انتظار می رود آخرین ورودی در هر خط مقداری باشد که با تعداد یا احتمال نسبی مطابقت دارد. دقیقاً یکی از vocab_file و unigram ها باید به این گزینه منتقل شود.
پیشفرض به ""
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-11-25 بهوقت ساعت هماهنگ جهانی.