ชั้นสุดท้ายประชาชน Skipgram
แยกวิเคราะห์ไฟล์ข้อความและสร้างกลุ่มตัวอย่าง
คลาสที่ซ้อนกัน
ระดับ | Skipgram.Options | คุณลักษณะที่จำเป็นสำหรับการ Skipgram |
วิธีการสาธารณะ
คง Skipgram | สร้าง ( ขอบเขต ขอบเขต String ชื่อไฟล์ยาว BatchSize, ตัวเลือก ... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่ปิดการดำเนินการ Skipgram ใหม่ |
เอาท์พุท <Integer> | currentEpoch () หมายเลขยุคปัจจุบัน |
เอาท์พุท <Integer> | ตัวอย่าง () เวกเตอร์ของรหัสคำ |
เอาท์พุท <Integer> | ป้ายกำกับ () เวกเตอร์ของรหัสคำ |
คง Skipgram.Options | minCount (Long minCount) |
คง Skipgram.Options | subsample (Float subsample) |
เอาท์พุท <ยาว> | totalWordsProcessed () จำนวนคำทั้งหมดที่ประมวลผลแล้ว |
เอาท์พุท <Integer> | vocabFreq () ความถี่ของคำ |
เอาท์พุท <String> | vocabWord () เวกเตอร์ของคำในคลังข้อมูล |
คง Skipgram.Options | windowSize (Long windowSize) |
เอาท์พุท <ยาว> | wordsPerEpoch () จำนวนคำต่อยุคในไฟล์ข้อมูล |
วิธีการสืบทอด
วิธีการสาธารณะ
สาธารณะคง Skipgram สร้าง ( ขอบเขต ขอบเขต String ชื่อไฟล์ยาว BatchSize, ตัวเลือก ... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ปิดการดำเนินการ Skipgram ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
ชื่อไฟล์ | ชื่อไฟล์ข้อความของคลังข้อมูล |
ขนาดชุด | ขนาดของชุดที่ผลิต |
ตัวเลือก | ดำเนินการค่าแอตทริบิวต์ทางเลือก |
คืนสินค้า
- ตัวอย่างใหม่ของSkipgram
สาธารณะคง Skipgram.Options minCount (Long minCount)
พารามิเตอร์
นาทีนับ | จำนวนคำขั้นต่ำที่จะรวมไว้ในคำศัพท์ |
---|
สาธารณะคง Skipgram.Options subsample (Float subsample)
พารามิเตอร์
ตัวอย่างย่อย | เกณฑ์สำหรับการเกิดคำ คำที่ปรากฏที่มีความถี่สูงกว่าจะถูกสุ่มตัวอย่างลง ตั้งค่าเป็น 0 เพื่อปิดการใช้งาน |
---|
สาธารณะคง Skipgram.Options windowSize (Long windowSize)
พารามิเตอร์
ขนาดหน้าต่าง | จำนวนคำทำนายทางซ้ายและขวาของเป้าหมาย |
---|