टेंसरफ़्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV5
#include <image_ops.h>
लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।
सारांश
पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को छांटना। score_threshold
से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए जाते हैं। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि मूल समन्वय प्रणाली में कहां है और आमतौर पर समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में अनुक्रमित पूर्णांकों का एक सेट है। चयनित सूचकांकों के अनुरूप बाउंडिंग बॉक्स निर्देशांक tf.gather operation
उपयोग करके प्राप्त किए जा सकते हैं। उदाहरण के लिए: चयनित_सूचकांक = tf.image.non_max_suppression_v2(बक्से, स्कोर, अधिकतम_आउटपुट_आकार, iou_थ्रेशोल्ड, स्कोर_थ्रेशोल्ड) चयनित_बॉक्स = tf.gather(बक्से, चयनित_सूचकांक) यह ऑप सॉफ्ट-एनएमएस (गॉसियन वेटिंग के साथ) मोड का भी समर्थन करता है (सीएफ बोडला एट अल) , https://arxiv.org/abs/1704.04503 ) जहां बक्से अन्य ओवरलैपिंग बक्सों को सीधे काटने के बजाय उनके स्कोर को कम कर देते हैं। इस सॉफ्ट-एनएमएस मोड को सक्षम करने के लिए, soft_nms_sigma
पैरामीटर को 0 से बड़ा करने के लिए सेट करें।
तर्क:
- स्कोप: एक स्कोप ऑब्जेक्ट
- बक्से: आकार का एक 2-डी फ्लोट टेंसर
[num_boxes, 4]
। - स्कोर: आकार का एक 1-डी फ्लोट टेंसर
[num_boxes]
प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। - max_output_size: एक अदिश पूर्णांक टेंसर, जो गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है।
- iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं।
- स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।
- Soft_nms_sigma: सॉफ्ट एनएमएस के लिए सिग्मा पैरामीटर का प्रतिनिधित्व करने वाला 0-डी फ्लोट टेंसर; बोडला एट अल देखें (cf https://arxiv.org/abs/1704.04503 )। जब
soft_nms_sigma=0.0
(जो डिफ़ॉल्ट है), हम मानक (हार्ड) NMS पर वापस आ जाते हैं।
वैकल्पिक विशेषताएँ (देखें Attrs
):
- पैड_टू_मैक्स_आउटपुट_साइज़: यदि सत्य है, तो आउटपुट
selected_indices
की लंबाईmax_output_size
है। डिफ़ॉल्ट से असत्य.
रिटर्न:
-
Output
चयनित_सूचकांक: आकार का एक 1-डी पूर्णांक टेंसर[M]
बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहांM <= max_output_size
। -
Output
चयनित_स्कोर: आकार का 1-डी फ्लोट टेंसर[M]
प्रत्येक चयनित बॉक्स के लिए संबंधित स्कोर का प्रतिनिधित्व करता है, जहांM <= max_output_size
। सॉफ्ट एनएमएस का उपयोग करते समय स्कोर केवल संबंधित इनपुट स्कोर से भिन्न होता है (यानी जबsoft_nms_sigma>0
) -
Output
वैध_आउटपुट: एक 0-डी पूर्णांक टेंसरselected_indices
में वैध तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें वैध तत्व पहले दिखाई देते हैं।
निर्माता और विध्वंसक | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
सार्वजनिक गुण | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
सार्वजनिक स्थैतिक कार्य | |
---|---|
PadToMaxOutputSize (bool x) |
संरचनाएँ | |
---|---|
टेंसरफ्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV5:: एटर्स | NonMaxSuppressionV5 के लिए वैकल्पिक विशेषता सेटर्स। |
सार्वजनिक गुण
संचालन
Operation operation
चयनित_सूचकांक
::tensorflow::Output selected_indices
चयनित_स्कोर
::tensorflow::Output selected_scores
वैध_आउटपुट
::tensorflow::Output valid_outputs
सार्वजनिक समारोह
नॉनमैक्ससप्रेशनV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
नॉनमैक्ससप्रेशनV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
सार्वजनिक स्थैतिक कार्य
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )