Skipgram kelas akhir publik
Mem-parsing file teks dan membuat sekumpulan contoh.
Kelas Bersarang
kelas | Skipgram.Opsi | Atribut opsional untuk Skipgram |
Metode Publik
Skipgram statis | |
Keluaran <Bilangan Bulat> | Zaman saat ini () Nomor zaman saat ini. |
Keluaran <Bilangan Bulat> | contoh () Vektor id kata. |
Keluaran <Bilangan Bulat> | label () Vektor id kata. |
Skipgram.Opsi statis | minCount (Panjang minCount) |
Skipgram.Opsi statis | subsampel (Subsampel mengambang) |
Keluaran <Panjang> | totalKata-kata yang Diproses () Jumlah total kata yang diproses sejauh ini. |
Keluaran <Bilangan Bulat> | frekuensi kosakata () Frekuensi kata-kata. |
Keluaran <String> | kosakataKata () Vektor kata-kata dalam korpus. |
Skipgram.Opsi statis | ukuran jendela (Ukuran jendela panjang) |
Keluaran <Panjang> | kata-kataPerEpoch () Jumlah kata per zaman dalam file data. |
Metode Warisan
Metode Publik
Skipgram statis publik dibuat ( Lingkup cakupan, Nama file string, Ukuran batch panjang, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi Skipgram baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
nama file | Nama file teks korpus. |
ukuran batch | Ukuran batch yang diproduksi. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru Skipgram
Skipgram statis publik. Opsi minCount (MinCount panjang)
Parameter
hitungan menit | Jumlah minimum kemunculan kata untuk dimasukkan ke dalam kosakata. |
---|
Subsampel Skipgram.Options statis publik (Subsampel mengambang)
Parameter
subsampel | Ambang batas kemunculan kata. Kata-kata yang muncul dengan frekuensi lebih tinggi akan diambil sampelnya secara acak. Setel ke 0 untuk menonaktifkan. |
---|
Keluaran publik <Bilangan Bulat> vocabFreq ()
Frekuensi kata-kata. Diurutkan dalam urutan non-ascending.
Skipgram statis publik. Opsi ukuran jendela (Ukuran jendela panjang)
Parameter
ukuran jendela | Jumlah kata yang akan diprediksi ke kiri dan kanan target. |
---|