टेंसरफ़्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV5

#include <image_ops.h>

लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।

सारांश

पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को छांटना। score_threshold से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए जाते हैं। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि मूल समन्वय प्रणाली में कहां है और आमतौर पर समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में अनुक्रमित पूर्णांकों का एक सेट है। चयनित सूचकांकों के अनुरूप बाउंडिंग बॉक्स निर्देशांक tf.gather operation उपयोग करके प्राप्त किए जा सकते हैं। उदाहरण के लिए: चयनित_सूचकांक = tf.image.non_max_suppression_v2(बक्से, स्कोर, अधिकतम_आउटपुट_आकार, iou_थ्रेशोल्ड, स्कोर_थ्रेशोल्ड) चयनित_बॉक्स = tf.gather(बक्से, चयनित_सूचकांक) यह ऑप सॉफ्ट-एनएमएस (गॉसियन वेटिंग के साथ) मोड का भी समर्थन करता है (सीएफ बोडला एट अल) , https://arxiv.org/abs/1704.04503 ) जहां बक्से अन्य ओवरलैपिंग बक्सों को सीधे काटने के बजाय उनके स्कोर को कम कर देते हैं। इस सॉफ्ट-एनएमएस मोड को सक्षम करने के लिए, soft_nms_sigma पैरामीटर को 0 से बड़ा करने के लिए सेट करें।

तर्क:

  • स्कोप: एक स्कोप ऑब्जेक्ट
  • बक्से: आकार का एक 2-डी फ्लोट टेंसर [num_boxes, 4]
  • स्कोर: आकार का एक 1-डी फ्लोट टेंसर [num_boxes] प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है।
  • max_output_size: एक अदिश पूर्णांक टेंसर, जो गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है।
  • iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं।
  • स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।
  • Soft_nms_sigma: सॉफ्ट एनएमएस के लिए सिग्मा पैरामीटर का प्रतिनिधित्व करने वाला 0-डी फ्लोट टेंसर; बोडला एट अल देखें (cf https://arxiv.org/abs/1704.04503 )। जब soft_nms_sigma=0.0 (जो डिफ़ॉल्ट है), हम मानक (हार्ड) NMS पर वापस आ जाते हैं।

वैकल्पिक विशेषताएँ (देखें Attrs ):

  • पैड_टू_मैक्स_आउटपुट_साइज़: यदि सत्य है, तो आउटपुट selected_indices की लंबाई max_output_size है। डिफ़ॉल्ट से असत्य.

रिटर्न:

  • Output चयनित_सूचकांक: आकार का एक 1-डी पूर्णांक टेंसर [M] बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहां M <= max_output_size
  • Output चयनित_स्कोर: आकार का 1-डी फ्लोट टेंसर [M] प्रत्येक चयनित बॉक्स के लिए संबंधित स्कोर का प्रतिनिधित्व करता है, जहां M <= max_output_size । सॉफ्ट एनएमएस का उपयोग करते समय स्कोर केवल संबंधित इनपुट स्कोर से भिन्न होता है (यानी जब soft_nms_sigma>0 )
  • Output वैध_आउटपुट: एक 0-डी पूर्णांक टेंसर selected_indices में वैध तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें वैध तत्व पहले दिखाई देते हैं।

निर्माता और विध्वंसक

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

सार्वजनिक गुण

operation
selected_indices
selected_scores
valid_outputs

सार्वजनिक स्थैतिक कार्य

PadToMaxOutputSize (bool x)

संरचनाएँ

टेंसरफ्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV5:: एटर्स

NonMaxSuppressionV5 के लिए वैकल्पिक विशेषता सेटर्स।

सार्वजनिक गुण

संचालन

Operation operation

चयनित_सूचकांक

::tensorflow::Output selected_indices

चयनित_स्कोर

::tensorflow::Output selected_scores

वैध_आउटपुट

::tensorflow::Output valid_outputs

सार्वजनिक समारोह

नॉनमैक्ससप्रेशनV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

नॉनमैक्ससप्रेशनV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

सार्वजनिक स्थैतिक कार्य

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)