dòng chảy căng:: ôi:: Đã sửa lỗiUnigramCandidateSampler:: Attr

#include <candidate_sampling_ops.h>

Trình thiết lập thuộc tính tùy chọn cho FixUnigramCandidateSampler .

Bản tóm tắt

Thuộc tính công khai

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Chức năng công cộng

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Sự biến dạng được sử dụng để làm lệch phân bố xác suất unigram.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Người dùng có thể tùy chọn thêm một số ID dành riêng trong phạm vi [0, ..., num_reserved_ids).
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Nếu hạt giống hoặc hạt giống2 được đặt khác 0, thì bộ tạo số ngẫu nhiên sẽ được gieo hạt giống đã cho.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Hạt giống thứ hai để tránh va chạm hạt giống.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Danh sách số lượng hoặc xác suất unigram, mỗi số một ID theo thứ tự tuần tự.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Mỗi dòng hợp lệ trong tệp này (phải có định dạng giống CSV) tương ứng với một ID từ hợp lệ.

Thuộc tính công khai

biến dạng_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shard_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

hạt giống2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

hạt giống_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

mảnh_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigram_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Chức năng công cộng

Biến dạng

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Sự biến dạng được sử dụng để làm lệch phân bố xác suất unigram.

Mỗi trọng số trước tiên được nâng lên tới mức độ biến dạng trước khi thêm vào phân phối unigram bên trong. Kết quả là, độ méo = 1,0 cho phép lấy mẫu unigram thông thường (như được xác định bởi tệp từ vựng) và độ méo = 0,0 mang lại sự phân bố đồng đều.

Mặc định là 1

SốId dành riêng

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Người dùng có thể tùy chọn thêm một số ID dành riêng trong phạm vi [0, ..., num_reserved_ids).

Một trường hợp sử dụng là mã thông báo từ đặc biệt không xác định được sử dụng làm ID 0. Các ID này sẽ có xác suất lấy mẫu là 0.

Mặc định là 0

số mảnh vỡ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song.

Tham số này (cùng với 'phân đoạn') cho biết số lượng phân vùng đang được sử dụng trong quá trình tính toán tổng thể.

Mặc định là 1

Hạt giống

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Nếu hạt giống hoặc hạt giống2 được đặt khác 0, thì bộ tạo số ngẫu nhiên sẽ được gieo hạt giống đã cho.

Nếu không, nó sẽ được gieo bởi một hạt giống ngẫu nhiên.

Mặc định là 0

Hạt giống2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Hạt giống thứ hai để tránh va chạm hạt giống.

Mặc định là 0

Mảnh vỡ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song.

Tham số này (cùng với 'num_shards') cho biết số phân vùng cụ thể của hoạt động lấy mẫu khi phân vùng đang được sử dụng.

Mặc định là 0

Unigram

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Danh sách số lượng hoặc xác suất unigram, mỗi số một ID theo thứ tự tuần tự.

Chính xác một trong số vocab_file và unigram sẽ được chuyển cho op này.

Mặc định là []

Tập tin từ vựng

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Mỗi dòng hợp lệ trong tệp này (phải có định dạng giống CSV) tương ứng với một ID từ hợp lệ.

ID được sắp xếp theo thứ tự, bắt đầu từ num_reserved_ids. Mục cuối cùng trong mỗi dòng dự kiến ​​​​sẽ là một giá trị tương ứng với số lượng hoặc xác suất tương đối. Chính xác một trong số vocab_file và unigram cần được chuyển tới op này.

Mặc định là ""