CTCLossV2

सार्वजनिक अंतिम वर्ग CTCLossV2

प्रत्येक बैच प्रविष्टि के लिए सीटीसी हानि (लॉग संभावना) की गणना करता है। गणना भी करता है

ढाल. यह क्लास आपके लिए सॉफ्टमैक्स ऑपरेशन करता है, इसलिए इनपुट LSTM द्वारा आउटपुट के रैखिक अनुमान जैसे होने चाहिए।

नेस्टेड क्लासेस

कक्षा CTCLossV2.विकल्प CTCLossV2 के लिए वैकल्पिक विशेषताएँ

सार्वजनिक तरीके

स्थिर CTCLossV2
बनाएं ( स्कोप स्कोप, ऑपरेंड <फ्लोट> इनपुट, ऑपरेंड <लॉन्ग> लेबल इंडेक्स, ऑपरेंड <इंटीजर> लेबल वैल्यूज, ऑपरेंड <इंटीजर> सीक्वेंस लेंथ, विकल्प... विकल्प)
एक नया CTCLossV2 ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
स्थिर CTCLossV2.विकल्प
ctcMergeRepeated (बूलियन ctcMergeRepeated)
आउटपुट <फ्लोट>
ढाल ()
`नुकसान` का ढाल.
स्थिर CTCLossV2.विकल्प
IgnoreLongerOutputsThanInputs (बूलियन IgnoreLongerOutputsThanInputs)
आउटपुट <फ्लोट>
नुकसान ()
एक वेक्टर (बैच) जिसमें लॉग-संभावनाएं शामिल हैं।
स्थिर CTCLossV2.विकल्प
प्रीप्रोसेसCollapseRepeated (बूलियन प्रीप्रोसेसCollapseRepeated)

विरासत में मिली विधियाँ

सार्वजनिक तरीके

सार्वजनिक स्थैतिक CTCLossV2 बनाएं ( स्कोप स्कोप, ऑपरेंड <फ्लोट> इनपुट, ऑपरेंड <लॉन्ग> लेबल इंडेक्स, ऑपरेंड <इंटेगर> लेबल वैल्यूज़, ऑपरेंड <इंटेगर> सीक्वेंस लेंथ, विकल्प... विकल्प)

एक नया CTCLossV2 ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
आदानों 3-डी, आकार: `(अधिकतम समय x बैच_आकार x संख्या_वर्ग)`, लॉगिट्स। डिफ़ॉल्ट रिक्त लेबल 0 है बल्कि num_classes - 1 है।
लेबलसूचकांक 'SparseTensor' के सूचकांक `. `labels_indices(i, :) == [b, t]` का अर्थ है `labels_values(i)` आईडी को `(बैच बी, समय टी)` के लिए संग्रहीत करता है।
लेबल मान दिए गए बैच और समय से जुड़े मान (लेबल)।
अनुक्रम लंबाई एक वेक्टर जिसमें अनुक्रम लंबाई (बैच) होती है।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • CTCLossV2 का एक नया उदाहरण

सार्वजनिक स्थैतिक CTCLossV2.Options ctcMergeRepeated (बूलियन ctcMergeRepeated)

पैरामीटर
ctcMergeRepeated अदिश. यदि गलत पर सेट किया जाता है, तो सीटीसी गणना के दौरान बार-बार गैर-रिक्त लेबल को मर्ज नहीं किया जाएगा और उन्हें अलग-अलग लेबल के रूप में समझा जाएगा। यह सीटीसी का सरलीकृत संस्करण है।

सार्वजनिक आउटपुट <फ्लोट> ग्रेडिएंट ()

`नुकसान` का ढाल. 3-डी, आकार: `(अधिकतम समय x बैच_आकार x संख्या_वर्ग)`।

सार्वजनिक स्थैतिक CTCLossV2.ऑप्शंस इग्नोरलॉन्गरऑउटपुट्सथानइनपुट्स (बूलियन इग्नोरलॉन्गरऑउटपुट्सथानइनपुट्स)

पैरामीटर
IgnoreLongerOutputsThanInputs अदिश. यदि सही पर सेट किया जाता है, तो सीटीसी गणना के दौरान, जिन आइटमों में इनपुट अनुक्रमों की तुलना में लंबे आउटपुट अनुक्रम होते हैं उन्हें छोड़ दिया जाता है: वे हानि अवधि में योगदान नहीं करते हैं और शून्य-ग्रेडिएंट रखते हैं।

सार्वजनिक आउटपुट <फ्लोट> हानि ()

एक वेक्टर (बैच) जिसमें लॉग-संभावनाएं शामिल हैं।

सार्वजनिक स्थैतिक CTCLossV2.Options प्रीप्रोसेसCollapseRepeated (बूलियन प्रीप्रोसेसCollapseRepeated)

पैरामीटर
प्रीप्रोसेससंक्षिप्तदोहराया गया स्केलर, यदि सत्य है तो सीटीसी गणना से पहले दोहराए गए लेबल संक्षिप्त हो जाते हैं।