หน้านี้ได้รับการแปลโดย Cloud Translation API

FixedUnigramCandidateSampler.Options

คงสาธารณะคลาสคงที่ คงUnigramCandidateSampler.Options

แอ็ตทริบิวต์ทางเลือกสำหรับ FixedUnigramCandidateSampler

วิธีการสาธารณะ

แก้ไข UnigramCandidateSampler.Options	การบิดเบือน (การบิดเบือนแบบลอย)
แก้ไข UnigramCandidateSampler.Options	numReservedIds (ยาว numReservedIds)
แก้ไข UnigramCandidateSampler.Options	numShards (ยาว numShards)
แก้ไข UnigramCandidateSampler.Options	เมล็ด (เมล็ดยาว)
แก้ไข UnigramCandidateSampler.Options	เมล็ด2 (เมล็ดยาว2)
แก้ไข UnigramCandidateSampler.Options	เศษ (เศษยาว)
แก้ไข UnigramCandidateSampler.Options	ยูนิแกรม (รายการ<Float> ยูนิแกรม)
แก้ไข UnigramCandidateSampler.Options	vocabFile (ไฟล์คำศัพท์สตริง)

วิธีการสืบทอด

จากคลาส java.lang.Object

บูลีน	เท่ากับ (วัตถุ arg0)
คลาสสุดท้าย<?>	รับคลาส ()
ภายใน	แฮชโค้ด ()
โมฆะสุดท้าย	แจ้ง ()
โมฆะสุดท้าย	แจ้งทั้งหมด ()
สตริง	toString ()
โมฆะสุดท้าย	รอสักครู่ (ยาว arg0, int arg1)
โมฆะสุดท้าย	รอ (ยาว arg0)
โมฆะสุดท้าย	รอ ()

วิธีการสาธารณะ

สาธารณะ คงการบิดเบือน UnigramCandidateSampler.Options (ความผิดเพี้ยนแบบลอย)

พารามิเตอร์

การบิดเบือน	การบิดเบือนจะใช้เพื่อบิดเบือนการแจกแจงความน่าจะเป็นแบบยูนิแกรม ตุ้มน้ำหนักแต่ละอันจะถูกยกขึ้นตามกำลังของการบิดเบือนก่อนจึงจะเพิ่มไปยังการแจกแจงแบบยูนิแกรมภายใน ผลก็คือ ความบิดเบี้ยว = 1.0 ให้การสุ่มตัวอย่างแบบยูนิแกรมปกติ (ตามที่กำหนดโดยไฟล์คำศัพท์) และการบิดเบือน = 0.0 ให้การแจกแจงแบบสม่ำเสมอ

การบิดเบือน

การบิดเบือนจะใช้เพื่อบิดเบือนการแจกแจงความน่าจะเป็นแบบยูนิแกรม ตุ้มน้ำหนักแต่ละอันจะถูกยกขึ้นตามกำลังของการบิดเบือนก่อนจึงจะเพิ่มไปยังการแจกแจงแบบยูนิแกรมภายใน ผลก็คือ ความบิดเบี้ยว = 1.0 ให้การสุ่มตัวอย่างแบบยูนิแกรมปกติ (ตามที่กำหนดโดยไฟล์คำศัพท์) และการบิดเบือน = 0.0 ให้การแจกแจงแบบสม่ำเสมอ

สาธารณะ FixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)

พารามิเตอร์

numReservedIds	นอกจากนี้ ผู้ใช้ยังสามารถเพิ่ม ID ที่สงวนไว้บางส่วนในช่วง [0, ..., num_reserved_ids) ได้ กรณีการใช้งานประการหนึ่งคือมีการใช้โทเค็นคำพิเศษที่ไม่รู้จักเป็น ID 0 รหัสเหล่านี้จะมีความน่าจะเป็นในการสุ่มตัวอย่างเป็น 0

numReservedIds

นอกจากนี้ ผู้ใช้ยังสามารถเพิ่ม ID ที่สงวนไว้บางส่วนในช่วง [0, ..., num_reserved_ids) ได้ กรณีการใช้งานประการหนึ่งคือมีการใช้โทเค็นคำพิเศษที่ไม่รู้จักเป็น ID 0 รหัสเหล่านี้จะมีความน่าจะเป็นในการสุ่มตัวอย่างเป็น 0

สาธารณะ คง UnigramCandidateSampler.Options numShards (Long numShards)

พารามิเตอร์

numShards	เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'shard') ระบุจำนวนพาร์ติชันที่ใช้ในการคำนวณโดยรวม

numShards

เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'shard') ระบุจำนวนพาร์ติชันที่ใช้ในการคำนวณโดยรวม

เมล็ดพันธุ์ FixUnigramCandidateSampler.Options สาธารณะ (เมล็ดยาว)

พารามิเตอร์

เมล็ดพันธุ์	หากเมล็ดพืชหรือเมล็ดพืช2 ถูกตั้งค่าไม่เป็นศูนย์ เครื่องกำเนิดตัวเลขสุ่มจะถูกเพาะโดยเมล็ดที่ให้มา มิฉะนั้นจะถูกเพาะโดยเมล็ดแบบสุ่ม

สาธารณะ FixedUnigramCandidateSampler.Options seed2 (Long seed2)

พารามิเตอร์

เมล็ดพันธุ์2	เมล็ดที่สองเพื่อหลีกเลี่ยงการชนกันของเมล็ด

สาธารณะ FixedUnigramCandidateSampler.Options shard (Long shard)

พารามิเตอร์

เศษ	เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'num_shards') ระบุหมายเลขพาร์ติชันเฉพาะของแซมเพลอร์ op เมื่อใช้การแบ่งพาร์ติชัน

สาธารณะ FixedUnigramCandidateSampler.Options unigrams (รายการ <Float> unigrams)

พารามิเตอร์

ยูนิแกรม	รายการจำนวนยูนิแกรมหรือความน่าจะเป็น หนึ่งรายการต่อ ID ตามลำดับ ควรส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้

สาธารณะ FixedUnigramCandidateSampler.Options vocabFile (สตริง vocabFile)

พารามิเตอร์

vocabFile	แต่ละบรรทัดที่ถูกต้องในไฟล์นี้ (ซึ่งควรมีรูปแบบคล้าย CSV) สอดคล้องกับรหัสคำที่ถูกต้อง รหัสจะเรียงลำดับตามลำดับ โดยเริ่มจาก num_reserved_ids รายการสุดท้ายในแต่ละบรรทัดคาดว่าจะเป็นค่าที่สอดคล้องกับการนับหรือความน่าจะเป็นแบบสัมพันธ์ ต้องส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้

vocabFile

แต่ละบรรทัดที่ถูกต้องในไฟล์นี้ (ซึ่งควรมีรูปแบบคล้าย CSV) สอดคล้องกับรหัสคำที่ถูกต้อง รหัสจะเรียงลำดับตามลำดับ โดยเริ่มจาก num_reserved_ids รายการสุดท้ายในแต่ละบรรทัดคาดว่าจะเป็นค่าที่สอดคล้องกับการนับหรือความน่าจะเป็นแบบสัมพันธ์ ต้องส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้