Halaman ini diterjemahkan oleh Cloud Translation API.

FixedUnigramCandidateSampler.Options

kelas statis publik FixedUnigramCandidateSampler.Options

Atribut opsional untuk FixedUnigramCandidateSampler

Metode Publik

MemperbaikiUnigramCandidateSampler.Options	distorsi (Distorsi mengambang)
MemperbaikiUnigramCandidateSampler.Options	numReservedIds (JumlahReservedIds panjang)
MemperbaikiUnigramCandidateSampler.Options	numShards (NumShards panjang)
MemperbaikiUnigramCandidateSampler.Options	benih (biji panjang)
MemperbaikiUnigramCandidateSampler.Options	seed2 (Benih panjang2)
MemperbaikiUnigramCandidateSampler.Options	pecahan (Pecahan panjang)
MemperbaikiUnigramCandidateSampler.Options	unigram (Daftar<Float> unigram)
MemperbaikiUnigramCandidateSampler.Options	vocabFile (String vocabFile)

Metode Warisan

Dari kelas java.lang.Object

boolean	sama dengan (Objek arg0)
Kelas terakhir<?>	dapatkan Kelas ()
ke dalam	Kode hash ()
kekosongan terakhir	memberitahu ()
kekosongan terakhir	beri tahuSemua ()
Rangkaian	keString ()
kekosongan terakhir	tunggu (arg0 panjang, int arg1)
kekosongan terakhir	tunggu (argumen panjang0)
kekosongan terakhir	Tunggu ()

Metode Publik

public FixedUnigramCandidateSampler. Distorsi opsi (Distorsi mengambang)

Parameter

distorsi	Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram. Setiap bobot pertama-tama dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Hasilnya, distorsi = 1.0 memberikan pengambilan sampel unigram yang teratur (seperti yang ditentukan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam.

public FixedUnigramCandidateSampler.Options numReservedIds (Jumlah PanjangReservedIds)

Parameter

jumlahReservedIds	Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna. Salah satu kasus penggunaannya adalah token kata khusus yang tidak diketahui digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel sebesar 0.

public FixedUnigramCandidateSampler.Options numShards (NumShards panjang)

Parameter

jumlah pecahan	Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam keseluruhan komputasi.

public FixedUnigramCandidateSampler.Options seed (Benih panjang)

Parameter

benih	Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan. Jika tidak, ia akan diunggulkan dengan benih acak.

public FixedUnigramCandidateSampler.Options seed2 (Benih panjang2)

Parameter

benih2	Benih kedua untuk menghindari benturan benih.

public FixedUnigramCandidateSampler.Options shard (Pecahan panjang)

Parameter

beling	Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan.

public FixedUnigramCandidateSampler.Options unigram (Daftar<Float> unigram)

Parameter

unigram	Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan. Tepatnya salah satu vocab_file dan unigram harus diteruskan ke operasi ini.

FixedUnigramCandidateSampler.Options vocabFile (String vocabFile) publik

Parameter

File kosakata	Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid. ID disusun secara berurutan, dimulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan berupa nilai yang sesuai dengan hitungan atau probabilitas relatif. Tepatnya salah satu vocab_file dan unigram perlu diteruskan ke operasi ini.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2025-07-26 UTC.