คงสาธารณะคลาสคงที่ คงUnigramCandidateSampler.Options
แอ็ตทริบิวต์ทางเลือกสำหรับ FixedUnigramCandidateSampler
วิธีการสาธารณะ
| แก้ไข UnigramCandidateSampler.Options | การบิดเบือน (การบิดเบือนแบบลอย) |
| แก้ไข UnigramCandidateSampler.Options | numReservedIds (ยาว numReservedIds) |
| แก้ไข UnigramCandidateSampler.Options | numShards (ยาว numShards) |
| แก้ไข UnigramCandidateSampler.Options | เมล็ด (เมล็ดยาว) |
| แก้ไข UnigramCandidateSampler.Options | เมล็ด2 (เมล็ดยาว2) |
| แก้ไข UnigramCandidateSampler.Options | เศษ (เศษยาว) |
| แก้ไข UnigramCandidateSampler.Options | ยูนิแกรม (รายการ<Float> ยูนิแกรม) |
| แก้ไข UnigramCandidateSampler.Options | vocabFile (ไฟล์คำศัพท์สตริง) |
วิธีการสืบทอด
วิธีการสาธารณะ
สาธารณะ คงการบิดเบือน UnigramCandidateSampler.Options (ความผิดเพี้ยนแบบลอย)
พารามิเตอร์
| การบิดเบือน | การบิดเบือนจะใช้เพื่อบิดเบือนการแจกแจงความน่าจะเป็นแบบยูนิแกรม ตุ้มน้ำหนักแต่ละอันจะถูกยกขึ้นตามกำลังของการบิดเบือนก่อนจึงจะเพิ่มไปยังการแจกแจงแบบยูนิแกรมภายใน ผลก็คือ ความบิดเบี้ยว = 1.0 ให้การสุ่มตัวอย่างแบบยูนิแกรมปกติ (ตามที่กำหนดโดยไฟล์คำศัพท์) และการบิดเบือน = 0.0 ให้การแจกแจงแบบสม่ำเสมอ |
|---|
สาธารณะ FixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)
พารามิเตอร์
| numReservedIds | นอกจากนี้ ผู้ใช้ยังสามารถเพิ่ม ID ที่สงวนไว้บางส่วนในช่วง [0, ..., num_reserved_ids) ได้ กรณีการใช้งานประการหนึ่งคือมีการใช้โทเค็นคำพิเศษที่ไม่รู้จักเป็น ID 0 รหัสเหล่านี้จะมีความน่าจะเป็นในการสุ่มตัวอย่างเป็น 0 |
|---|
สาธารณะ คง UnigramCandidateSampler.Options numShards (Long numShards)
พารามิเตอร์
| numShards | เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'shard') ระบุจำนวนพาร์ติชันที่ใช้ในการคำนวณโดยรวม |
|---|
เมล็ดพันธุ์ FixUnigramCandidateSampler.Options สาธารณะ (เมล็ดยาว)
พารามิเตอร์
| เมล็ดพันธุ์ | หากเมล็ดพืชหรือเมล็ดพืช2 ถูกตั้งค่าไม่เป็นศูนย์ เครื่องกำเนิดตัวเลขสุ่มจะถูกเพาะโดยเมล็ดที่ให้มา มิฉะนั้นจะถูกเพาะโดยเมล็ดแบบสุ่ม |
|---|
สาธารณะ FixedUnigramCandidateSampler.Options seed2 (Long seed2)
พารามิเตอร์
| เมล็ดพันธุ์2 | เมล็ดที่สองเพื่อหลีกเลี่ยงการชนกันของเมล็ด |
|---|
สาธารณะ FixedUnigramCandidateSampler.Options shard (Long shard)
พารามิเตอร์
| เศษ | เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'num_shards') ระบุหมายเลขพาร์ติชันเฉพาะของแซมเพลอร์ op เมื่อใช้การแบ่งพาร์ติชัน |
|---|
สาธารณะ FixedUnigramCandidateSampler.Options unigrams (รายการ <Float> unigrams)
พารามิเตอร์
| ยูนิแกรม | รายการจำนวนยูนิแกรมหรือความน่าจะเป็น หนึ่งรายการต่อ ID ตามลำดับ ควรส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้ |
|---|
สาธารณะ FixedUnigramCandidateSampler.Options vocabFile (สตริง vocabFile)
พารามิเตอร์
| vocabFile | แต่ละบรรทัดที่ถูกต้องในไฟล์นี้ (ซึ่งควรมีรูปแบบคล้าย CSV) สอดคล้องกับรหัสคำที่ถูกต้อง รหัสจะเรียงลำดับตามลำดับ โดยเริ่มจาก num_reserved_ids รายการสุดท้ายในแต่ละบรรทัดคาดว่าจะเป็นค่าที่สอดคล้องกับการนับหรือความน่าจะเป็นแบบสัมพันธ์ ต้องส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้ |
|---|