CTCLossV2

सार्वजनिक अंतिम वर्ग CTCLossV2

प्रत्येक बैच प्रविष्टि के लिए सीटीसी हानि (लॉग संभावना) की गणना करता है। गणना भी करता है

ढाल. यह क्लास आपके लिए सॉफ्टमैक्स ऑपरेशन करता है, इसलिए इनपुट LSTM द्वारा आउटपुट के रैखिक अनुमान जैसे होने चाहिए।

नेस्टेड क्लासेस

कक्षा CTCLossV2.विकल्प CTCLossV2 के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

स्थिर CTCLossV2
बनाएं ( स्कोप स्कोप, ऑपरेंड < TFloat32 > इनपुट, ऑपरेंड < TInt64 > लेबलइंडिसेस, ऑपरेंड < TInt32 > लेबल वैल्यूज़, ऑपरेंड < TInt32 > अनुक्रम लंबाई, विकल्प... विकल्प)
एक नया CTCLossV2 ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
स्थिर CTCLossV2.विकल्प
ctcMergeRepeated (बूलियन ctcMergeRepeated)
आउटपुट < TFloat32 >
ढाल ()
`नुकसान` का ढाल.
स्थिर CTCLossV2.विकल्प
IgnoreLongerOutputsThanInputs (बूलियन IgnoreLongerOutputsThanInputs)
आउटपुट < TFloat32 >
नुकसान ()
एक वेक्टर (बैच) जिसमें लॉग-संभावनाएं शामिल हैं।
स्थिर CTCLossV2.विकल्प
प्रीप्रोसेसCollapseRepeated (बूलियन प्रीप्रोसेसCollapseRepeated)

विरासत में मिली विधियाँ

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "CTCLossV2"

सार्वजनिक तरीके

सार्वजनिक स्थैतिक CTCLossV2 बनाएं ( स्कोप स्कोप, ऑपरेंड <TFloat32> इनपुट, ऑपरेंड <TInt64> लेबलइंडिसेस, ऑपरेंड <TInt32> लेबलवैल्यू, ऑपरेंड <TInt32> अनुक्रम लंबाई, विकल्प... विकल्प)

एक नया CTCLossV2 ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
आदानों 3-डी, आकार: `(अधिकतम समय x बैच_आकार x संख्या_वर्ग)`, लॉगिट्स। डिफ़ॉल्ट रिक्त लेबल 0 है बल्कि num_classes - 1 है।
लेबलसूचकांक 'SparseTensor' के सूचकांक `. `labels_indices(i, :) == [b, t]` का अर्थ है `labels_values(i)` आईडी को `(बैच बी, समय टी)` के लिए संग्रहीत करता है।
लेबल मान दिए गए बैच और समय से जुड़े मान (लेबल)।
अनुक्रम लंबाई एक वेक्टर जिसमें अनुक्रम लंबाई (बैच) होती है।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • CTCLossV2 का एक नया उदाहरण

सार्वजनिक स्थैतिक CTCLossV2.Options ctcMergeRepeated (बूलियन ctcMergeRepeated)

पैरामीटर
ctcMergeRepeated अदिश. यदि गलत पर सेट किया जाता है, तो सीटीसी गणना के दौरान बार-बार गैर-रिक्त लेबल को मर्ज नहीं किया जाएगा और उन्हें अलग-अलग लेबल के रूप में समझा जाएगा। यह सीटीसी का सरलीकृत संस्करण है।

सार्वजनिक आउटपुट < TFloat32 > ग्रेडिएंट ()

`नुकसान` का ढाल. 3-डी, आकार: `(अधिकतम समय x बैच_आकार x संख्या_वर्ग)`।

सार्वजनिक स्थैतिक CTCLossV2.ऑप्शंस इग्नोरलॉन्गरऑउटपुट्सथानइनपुट्स (बूलियन इग्नोरलॉन्गरऑउटपुट्सथानइनपुट्स)

पैरामीटर
IgnoreLongerOutputsThanInputs अदिश. यदि सही पर सेट किया जाता है, तो सीटीसी गणना के दौरान, जिन आइटमों में इनपुट अनुक्रमों की तुलना में लंबे आउटपुट अनुक्रम होते हैं उन्हें छोड़ दिया जाता है: वे हानि अवधि में योगदान नहीं करते हैं और शून्य-ग्रेडिएंट रखते हैं।

सार्वजनिक आउटपुट < TFloat32 > हानि ()

एक वेक्टर (बैच) जिसमें लॉग-संभावनाएं शामिल हैं।

सार्वजनिक स्थैतिक CTCLossV2.Options प्रीप्रोसेसCollapseRepeated (बूलियन प्रीप्रोसेसCollapseRepeated)

पैरामीटर
प्रीप्रोसेससंक्षिप्तदोहराया गया स्केलर, यदि सत्य है तो सीटीसी गणना से पहले दोहराए गए लेबल संक्षिप्त हो जाते हैं।