Hadiri Simposium Women in ML pada 7 Desember Daftar sekarang

tensorflow :: ops :: FixedUnigramCandidateSampler :: Attrs

#include <candidate_sampling_ops.h>

Penyetel atribut opsional untuk FixedUnigramCandidateSampler .

Ringkasan

Atribut publik

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Fungsi publik

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Distorsi digunakan untuk memiringkan distribusi probabilitas unigram.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Secara opsional, beberapa ID yang dipesan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat seluruh komputasi melalui paralelisme.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Jika salah satu benih atau benih2 ditetapkan menjadi bukan nol, generator nomor acak disebarkan oleh benih yang diberikan.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Benih kedua untuk menghindari tabrakan benih.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat seluruh komputasi melalui paralelisme.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Setiap baris valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid.

Atribut publik

distorsi_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

seed2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

benih_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

beling_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigrams_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Fungsi publik

Distorsi

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Distorsi digunakan untuk memiringkan distribusi probabilitas unigram.

Setiap bobot terlebih dahulu dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Akibatnya, distorsi = 1.0 memberikan sampling unigram reguler (seperti yang didefinisikan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam.

Default-nya adalah 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Secara opsional, beberapa ID yang dipesan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna.

Salah satu kasus penggunaan adalah bahwa token kata khusus yang tidak dikenal digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel 0.

Default-nya 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat seluruh komputasi melalui paralelisme.

Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam komputasi keseluruhan.

Default-nya adalah 1

Benih

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Jika salah satu benih atau benih2 ditetapkan menjadi bukan nol, generator nomor acak disebarkan oleh benih yang diberikan.

Jika tidak, itu diunggulkan dengan benih acak.

Default-nya 0

Benih2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Benih kedua untuk menghindari tabrakan benih.

Default-nya 0

Beling

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat seluruh komputasi melalui paralelisme.

Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan.

Default-nya 0

Unigrams

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan.

Salah satu vocab_file dan unigram harus diteruskan ke operasi ini.

Default-nya adalah []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)
.dll

Setiap baris valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid.

ID disusun secara berurutan, mulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan menjadi nilai yang sesuai dengan hitungan atau probabilitas relatif. Salah satu vocab_file dan unigram harus diteruskan ke operasi ini.

Default-nya adalah ""