टेंसरफ़्लो:: ऑप्स:: कंबाइंडनॉनमैक्ससप्रेशन
#include <image_ops.h>लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।
सारांश
यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर नॉन_मैक्स_सप्रेशन करता है। पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को काट-छांट कर हटा दें। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि समन्वय प्रणाली में मूल कहां है। यह भी ध्यान दें कि यह एल्गोरिदम समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट अंतिम बॉक्स, स्कोर और क्लास टेंसर है जो नॉन_मैक्स_सप्रेशन करने के बाद लौटाया जाता है।
तर्क:
- स्कोप: एक स्कोप ऑब्जेक्ट
- बक्से: आकार का एक 4-डी फ्लोट टेंसर
[batch_size, num_boxes, q, 4]। यदिq1 है तो सभी वर्गों के लिए समान बक्से का उपयोग किया जाता है अन्यथा, यदिqवर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है। - स्कोर: आकार का एक 3-डी फ्लोट टेंसर
[batch_size, num_boxes, num_classes]प्रत्येक बॉक्स (बक्से की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। - max_output_size_per_class: एक अदिश पूर्णांक टेंसर जो प्रति वर्ग गैर अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है
- max_total_size: सभी वर्गों में रखे गए बक्सों की अधिकतम संख्या का प्रतिनिधित्व करने वाला एक अदिश।
- iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं।
- स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।
वैकल्पिक विशेषताएँ (देखें Attrs ):
- पैड_पर_क्लास: यदि गलत है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को
max_total_sizeपर पैड/क्लिप किया जाता है। यदि सही है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास कोmax_size_per_class*num_classesकी लंबाई के लिए पैड किया जाता है, जब तक कि यहmax_total_sizeसे अधिक न हो जाए, जिस स्थिति में इसेmax_total_sizeपर क्लिप किया जाता है। डिफ़ॉल्ट से असत्य. - क्लिप_बॉक्स: यदि सत्य है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और यदि वे [0, 1] से आगे गिरते हैं तो आउटपुट बॉक्स को क्लिप करें। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को वैसे ही आउटपुट करें जैसे वह है।
रिटर्न:
-
Outputnmsed_boxes: एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बॉक्स होते हैं। -
Outputnmsed_scores: एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं। -
Outputnmsed_classes: एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं होती हैं। -
Outputवैलिड_डिटेक्शन: एक [बैच_साइज] int32 टेंसर जो प्रति बैच आइटम वैध डिटेक्शन की संख्या दर्शाता है। nms_boxes[i], nms_scores[i] और nms_class[i] में केवल शीर्ष num_detections[i] प्रविष्टियाँ मान्य हैं। शेष प्रविष्टियाँ शून्य पैडिंग हैं।
निर्माता और विध्वंसक | |
|---|---|
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs) |
सार्वजनिक गुण | |
|---|---|
nmsed_boxes | |
nmsed_classes | |
nmsed_scores | |
operation | |
valid_detections | |
सार्वजनिक स्थैतिक कार्य | |
|---|---|
ClipBoxes (bool x) | |
PadPerClass (bool x) | |
संरचनाएँ | |
|---|---|
| टेंसरफ्लो:: ऑप्स:: कंबाइंडनॉनमैक्ससप्रेशन:: एटर्स | CombindNonMaxSuppression के लिए वैकल्पिक विशेषता सेटर्स। |
सार्वजनिक गुण
nmsed_boxes
::tensorflow::Output nmsed_boxes
nmsed_classes
::tensorflow::Output nmsed_classes
nmsed_scores
::tensorflow::Output nmsed_scores
संचालन
Operation operation
वैध_डिटेक्शन
::tensorflow::Output valid_detections
सार्वजनिक समारोह
कंबाइंडनॉनमैक्ससप्रेशन
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
कंबाइंडनॉनमैक्ससप्रेशन
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs )
सार्वजनिक स्थैतिक कार्य
क्लिपबॉक्स
Attrs ClipBoxes( bool x )
पैडपरक्लास
Attrs PadPerClass( bool x )