Skipgram

Skipgram kelas akhir publik

Mem-parsing file teks dan membuat sekumpulan contoh.

Kelas Bersarang

kelas Skipgram.Opsi Atribut opsional untuk Skipgram

Metode Publik

Skipgram statis
buat ( Lingkup cakupan , Nama file string, Ukuran batch panjang, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi Skipgram baru.
Keluaran <Bilangan Bulat>
Zaman saat ini ()
Nomor zaman saat ini.
Keluaran <Bilangan Bulat>
contoh ()
Vektor id kata.
Keluaran <Bilangan Bulat>
label ()
Vektor id kata.
Skipgram.Opsi statis
minCount (Panjang minCount)
Skipgram.Opsi statis
subsampel (Subsampel mengambang)
Keluaran <Panjang>
totalKata-kata yang Diproses ()
Jumlah total kata yang diproses sejauh ini.
Keluaran <Bilangan Bulat>
frekuensi kosakata ()
Frekuensi kata-kata.
Keluaran <String>
kosakataKata ()
Vektor kata-kata dalam korpus.
Skipgram.Opsi statis
ukuran jendela (Ukuran jendela panjang)
Keluaran <Panjang>
kata-kataPerEpoch ()
Jumlah kata per zaman dalam file data.

Metode Warisan

Metode Publik

Skipgram statis publik dibuat ( Lingkup cakupan, Nama file string, Ukuran batch panjang, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi Skipgram baru.

Parameter
cakupan ruang lingkup saat ini
nama file Nama file teks korpus.
ukuran batch Ukuran batch yang diproduksi.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru Skipgram

Output publik <Bilangan Bulat> Epoch saat ini ()

Nomor zaman saat ini.

contoh Output publik <Integer> ()

Vektor id kata.

Label Output publik <Bilangan Bulat> ()

Vektor id kata.

Skipgram statis publik. Opsi minCount (MinCount panjang)

Parameter
hitungan menit Jumlah minimum kemunculan kata untuk dimasukkan ke dalam kosakata.

Subsampel Skipgram.Options statis publik (Subsampel mengambang)

Parameter
subsampel Ambang batas kemunculan kata. Kata-kata yang muncul dengan frekuensi lebih tinggi akan diambil sampelnya secara acak. Setel ke 0 untuk menonaktifkan.

Output publik <Panjang> totalWordsProcessed ()

Jumlah total kata yang diproses sejauh ini.

Keluaran publik <Bilangan Bulat> vocabFreq ()

Frekuensi kata-kata. Diurutkan dalam urutan non-ascending.

Keluaran publik <String> vocabWord ()

Vektor kata-kata dalam korpus.

Skipgram statis publik. Opsi ukuran jendela (Ukuran jendela panjang)

Parameter
ukuran jendela Jumlah kata yang akan diprediksi ke kiri dan kanan target.

publik Output <Panjang> kataPerEpoch ()

Jumlah kata per zaman dalam file data.