CTCLossV2

คลาสสุดท้ายสาธารณะ CTCLossV2

คำนวณการสูญเสีย CTC (ความน่าจะเป็นของบันทึก) สำหรับรายการแบตช์แต่ละรายการ คำนวณด้วย

การไล่ระดับสี คลาสนี้ดำเนินการ softmax ให้กับคุณ ดังนั้นอินพุตควรเป็น เช่น การฉายเอาต์พุตเชิงเส้นโดย LSTM

คลาสที่ซ้อนกัน

ระดับ CTCLossV2.ตัวเลือก แอ็ตทริบิวต์ทางเลือกสำหรับ CTCLossV2

วิธีการสาธารณะ

CTCLossV2 แบบคงที่
สร้าง (ขอบเขต ขอบเขต , ตัวดำเนินการ <Float> อินพุต, ตัวดำเนินการ <Long> labelIndices, ตัวดำเนินการ <Integer> labelValues, ตัวดำเนินการ <Integer> sequenceLength, ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ CTCLossV2 ใหม่
CTCLossV2.Options แบบคงที่
ctcMergeRepeated (บูลีน ctcMergeRepeated)
เอาท์พุต <โฟลต>
ไล่ระดับ ()
การไล่ระดับสีของ 'การสูญเสีย'
CTCLossV2.Options แบบคงที่
ละเว้นLongerOutputsThanInputs (บูลีนละเว้นLongerOutputsThanInputs)
เอาท์พุต <โฟลต>
การสูญเสีย ()
เวกเตอร์ (แบทช์) ที่มีความน่าจะเป็นของบันทึก
CTCLossV2.Options แบบคงที่
preprocessCollapseRepeated (บูลีน preprocessCollapseRepeated)

วิธีการสืบทอด

วิธีการสาธารณะ

สร้าง CTCLossV2 แบบคงที่สาธารณะ (ขอบเขต ขอบเขต , ตัวดำเนินการ <Float> อินพุต, ตัวดำเนินการ <Long> labelIndices, ตัวดำเนินการ <Integer> labelValues, ตัวดำเนินการ <Integer> sequenceLength, ตัวเลือก... ตัวเลือก)

วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ CTCLossV2 ใหม่

พารามิเตอร์
ขอบเขต ขอบเขตปัจจุบัน
อินพุต สามมิติ รูปร่าง: `(เวลาสูงสุด x ขนาดแบตช์ x num_classes)` บันทึก ป้ายกำกับว่างเริ่มต้นคือ 0 แทนที่จะเป็น num_classes - 1
ป้ายดัชนี ดัชนีของ `SparseTensor `. `labels_indices(i, :) == [b, t]` หมายถึง `labels_values(i)` เก็บ id สำหรับ `(batch b, time t)`
ค่าป้ายกำกับ ค่า (ป้ายกำกับ) ที่เกี่ยวข้องกับชุดและเวลาที่กำหนด
ลำดับความยาว เวกเตอร์ที่มีความยาวลำดับ (แบทช์)
ตัวเลือก มีค่าแอตทริบิวต์ทางเลือก
การส่งคืน
  • อินสแตนซ์ใหม่ของ CTCLossV2

CTCLossV2.Options ctcMergeRepeated สาธารณะแบบคงที่ (บูลีน ctcMergeRepeated)

พารามิเตอร์
ctcMerge ซ้ำแล้วซ้ำอีก สเกลาร์ หากตั้งค่าเป็นเท็จ ในระหว่าง การคำนวณ CTC ป้ายกำกับที่ไม่ว่างเปล่าซ้ำๆ จะไม่ถูกผสานและตีความว่าเป็นป้ายกำกับแต่ละรายการ นี่เป็น CTC เวอร์ชันที่เรียบง่าย

การไล่ ระดับสี เอาท์พุท สาธารณะ <Float> ()

การไล่ระดับสีของ 'การสูญเสีย' สามมิติ รูปร่าง: `(เวลาสูงสุด x ขนาดชุด x num_classes)`

CTCLossV2 แบบคงที่สาธารณะ ตัวเลือกละเว้นLongerOutputsThanInputs (บูลีนละเว้นLongerOutputsThanInputs)

พารามิเตอร์
ละเลยLongerOutputsThanInputs สเกลาร์ หากตั้งค่าเป็นจริง ในระหว่างการคำนวณ CTC รายการที่มีลำดับเอาต์พุตยาวกว่าลำดับอินพุตจะถูกข้ามไป รายการเหล่านั้นไม่ส่งผลต่อเงื่อนไขการสูญเสียและมีการไล่ระดับเป็นศูนย์

การสูญเสีย เอาท์พุท สาธารณะ <Float> ()

เวกเตอร์ (แบทช์) ที่มีความน่าจะเป็นของบันทึก

CTCLossV2 แบบคงที่สาธารณะ ตัวเลือก preprocessCollapseRepeated (บูลีน preprocessCollapseRepeated)

พารามิเตอร์
ประมวลผลล่วงหน้ายุบซ้ำแล้วซ้ำอีก สเกลาร์ หากเป็นจริง ป้ายกำกับที่ซ้ำกันจะถูกยุบก่อนการคำนวณ CTC