genel statik sınıf FixUnigramCandidateSampler.Options
FixedUnigramCandidateSampler
için isteğe bağlı özellikler
Genel Yöntemler
SabitUnigramCandidateSampler.Options | distorsiyon (Kayan distorsiyon) |
SabitUnigramCandidateSampler.Options | numReservedIds (Uzun numReservedIds) |
SabitUnigramCandidateSampler.Options | numShards (Uzun numShards) |
SabitUnigramCandidateSampler.Options | tohum (Uzun tohum) |
SabitUnigramCandidateSampler.Options | tohum2 (Uzun tohum2) |
SabitUnigramCandidateSampler.Options | parça (Uzun parça) |
SabitUnigramCandidateSampler.Options | unigramlar (Liste<Float> unigramlar) |
SabitUnigramCandidateSampler.Options | vocabDosyası (Dize vocabDosyası) |
Kalıtsal Yöntemler
Genel Yöntemler
public DifferentUnigramCandidateSampler.Options distorsiyonu (Float distorsiyonu)
Parametreler
çarpıtma | Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır. Her ağırlık, dahili unigram dağılımına eklenmeden önce ilk olarak distorsiyonun gücüne yükseltilir. Sonuç olarak, distorsiyon = 1,0, düzenli unigram örneklemeyi (kelime dosyası tarafından tanımlandığı gibi) verir ve distorsiyon = 0,0, düzgün bir dağılım verir. |
---|
public DifferentUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)
Parametreler
numReservedIds | İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir. Bir kullanım durumu, özel bir bilinmeyen kelime belirtecinin ID 0 olarak kullanılmasıdır. Bu ID'lerin örnekleme olasılığı 0 olacaktır. |
---|
public DifferentUnigramCandidateSampler.Options numShards (Uzun numShards)
Parametreler
SayıParçaları | Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. Bu parametre ('shard' ile birlikte) genel hesaplamada kullanılan bölüm sayısını gösterir. |
---|
public DifferentUnigramCandidateSampler.Options tohumu (Uzun tohum)
Parametreler
tohum | Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır. Aksi takdirde rastgele bir tohumla tohumlanır. |
---|
public SabitUnigramCandidateSampler.Options tohum2 (Uzun tohum2)
Parametreler
tohum2 | Tohum çarpışmasını önlemek için ikinci bir tohum. |
---|
public DifferentUnigramCandidateSampler.Options parça (Uzun parça)
Parametreler
kırık | Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. Bu parametre ('num_shards' ile birlikte), bölümleme kullanıldığında bir örnekleyici işleminin belirli bölüm numarasını gösterir. |
---|
public DifferentUnigramCandidateSampler.Options unigramları (List<Float> unigramları)
Parametreler
unigramlar | Unigram sayımlarının veya olasılıklarının, kimlik başına sıralı bir şekilde bir listesi. Bu operasyona vocab_file ve unigramlardan tam olarak biri aktarılmalıdır. |
---|
public DifferentUnigramCandidateSampler.Options vocabFile (String vocabFile)
Parametreler
kelimeDosyası | Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir. Kimlikler num_reserved_ids'den başlayarak sıralıdır. Her satırdaki son girişin sayıma veya bağıl olasılığa karşılık gelen bir değer olması beklenir. Bu operasyona vocab_file ve unigramlardan tam olarak birinin aktarılması gerekiyor. |
---|