CombinedNonMaxSuppression

सार्वजनिक अंतिम वर्ग कंबाइंडनॉनमैक्ससप्रेशन

लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है,

यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर नॉन_मैक्स_सप्रेशन करता है। पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को काट-छांट कर हटा दें। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि समन्वय प्रणाली में मूल कहां है। यह भी ध्यान दें कि यह एल्गोरिदम समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट अंतिम बॉक्स, स्कोर और क्लास टेंसर है जो नॉन_मैक्स_सप्रेशन करने के बाद लौटाया जाता है।

नेस्टेड क्लासेस

कक्षा संयुक्तनॉनमैक्ससप्रेशन.विकल्प CombinedNonMaxSuppression के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस
क्लिपबॉक्स (बूलियन क्लिपबॉक्स)
स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन
बनाएं ( स्कोप स्कोप, ऑपरेंड < TFloat32 > बॉक्स, ऑपरेंड < TFloat32 > स्कोर, ऑपरेंड < TInt32 > maxOutputSizePerClass, ऑपरेंड < TInt32 > maxTotalSize, ऑपरेंड < TFloat32 > iouThreshold, ऑपरेंड < TFloat32 > स्कोर थ्रेशोल्ड, विकल्प... विकल्प)
एक नए कंबाइंडनॉनमैक्ससप्रेशन ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
आउटपुट < TFloat32 >
nmsedBoxes ()
एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बक्से होते हैं।
आउटपुट < TFloat32 >
nmsedClasses ()
एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं शामिल हैं।
आउटपुट < TFloat32 >
nmsedScores ()
एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं।
स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस
पैडपेरक्लास (बूलियन पैडपेरक्लास)
आउटपुट <TInt32>
मान्य पहचान ()
एक [बैच_आकार] int32 टेंसर जो प्रति बैच आइटम के लिए मान्य पहचानों की संख्या दर्शाता है।

विरासत में मिली विधियाँ

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "CombinedNonMaxSuppression"

सार्वजनिक तरीके

सार्वजनिक स्थैतिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस क्लिपबॉक्स (बूलियन क्लिपबॉक्स)

पैरामीटर
क्लिपबॉक्स यदि सत्य है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और यदि वे [0, 1] से आगे गिरते हैं तो आउटपुट बॉक्स को क्लिप करें। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को वैसे ही आउटपुट करें जैसे वह है।

सार्वजनिक स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन क्रिएट ( स्कोप स्कोप, ऑपरेंड < TFloat32 > बॉक्स, ऑपरेंड < TFloat32 > स्कोर, ऑपरेंड < TInt32 > maxOutputSizePerClass, ऑपरेंड < TInt32 > maxTotalSize, ऑपरेंड < TFloat32 > iouThreshold, ऑपरेंड < TFloat32 > स्कोर थ्रेशोल्ड, विकल्प... विकल्प)

एक नए कंबाइंडनॉनमैक्ससप्रेशन ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
बक्से `[batch_size, num_boxes, q, 4]` आकार का एक 4-डी फ्लोट टेंसर। यदि `q` 1 है तो सभी वर्गों के लिए समान बक्से का उपयोग किया जाता है अन्यथा, यदि `q` वर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है।
स्कोर `[बैच_आकार, संख्या_बॉक्स, संख्या_वर्ग]` आकार का एक 3-डी फ्लोट टेंसर प्रत्येक बॉक्स (बक्से की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है।
maxOutputSizePerClass एक अदिश पूर्णांक टेंसर, जो प्रति वर्ग गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है
अधिकतम कुल आकार सभी वर्गों में रखे गए बक्सों की अधिकतम संख्या को दर्शाने वाला एक अदिश राशि।
iouदहलीज एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स आईओयू के संबंध में बहुत अधिक ओवरलैप करते हैं।
स्कोर सीमा एक 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • CombinedNonMaxSuppression का एक नया उदाहरण

सार्वजनिक आउटपुट < TFloat32 > nmsedBoxes ()

एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बक्से होते हैं।

सार्वजनिक आउटपुट < TFloat32 > nmsedClasses ()

एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं शामिल हैं।

सार्वजनिक आउटपुट < TFloat32 > nmsedScores ()

एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं।

सार्वजनिक स्थैतिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस पैडपेरक्लास (बूलियन पैडपेरक्लास)

पैरामीटर
पैडपरक्लास यदि गलत है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को `max_total_size` पर पैड/क्लिप किया जाता है। यदि सही है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास की लंबाई `max_size_per_class`*`num_classes` है, जब तक कि यह `max_total_size` से अधिक न हो जाए, जिस स्थिति में इसे `max_total_size` पर क्लिप किया जाता है। डिफ़ॉल्ट से असत्य.

सार्वजनिक आउटपुट <TInt32> वैधडिटेक्शन ()

एक [बैच_आकार] int32 टेंसर जो प्रति बैच आइटम के लिए मान्य पहचानों की संख्या दर्शाता है। nms_boxes[i], nms_scores[i] और nms_class[i] में केवल शीर्ष num_detections[i] प्रविष्टियाँ मान्य हैं। शेष प्रविष्टियाँ शून्य पैडिंग हैं।