टेंसरफ़्लो:: ऑप्स:: कंबाइंडनॉनमैक्ससप्रेशन

#include <image_ops.h>

लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।

सारांश

यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर नॉन_मैक्स_सप्रेशन करता है। पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को काट-छांट कर हटा दें। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि समन्वय प्रणाली में मूल कहां है। यह भी ध्यान दें कि यह एल्गोरिदम समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट अंतिम बॉक्स, स्कोर और क्लास टेंसर है जो नॉन_मैक्स_सप्रेशन करने के बाद लौटाया जाता है।

तर्क:

  • स्कोप: एक स्कोप ऑब्जेक्ट
  • बक्से: आकार का एक 4-डी फ्लोट टेंसर [batch_size, num_boxes, q, 4] । यदि q 1 है तो सभी वर्गों के लिए समान बक्से का उपयोग किया जाता है अन्यथा, यदि q वर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है।
  • स्कोर: आकार का एक 3-डी फ्लोट टेंसर [batch_size, num_boxes, num_classes] प्रत्येक बॉक्स (बक्से की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है।
  • max_output_size_per_class: एक अदिश पूर्णांक टेंसर जो प्रति वर्ग गैर अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है
  • max_total_size: सभी वर्गों में रखे गए बक्सों की अधिकतम संख्या का प्रतिनिधित्व करने वाला एक अदिश।
  • iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं।
  • स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।

वैकल्पिक विशेषताएँ (देखें Attrs ):

  • पैड_पर_क्लास: यदि गलत है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को max_total_size पर पैड/क्लिप किया जाता है। यदि सही है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को max_size_per_class * num_classes की लंबाई के लिए पैड किया जाता है, जब तक कि यह max_total_size से अधिक न हो जाए, जिस स्थिति में इसे max_total_size पर क्लिप किया जाता है। डिफ़ॉल्ट से असत्य.
  • क्लिप_बॉक्स: यदि सत्य है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और यदि वे [0, 1] से आगे गिरते हैं तो आउटपुट बॉक्स को क्लिप करें। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को वैसे ही आउटपुट करें जैसे वह है।

रिटर्न:

  • Output nmsed_boxes: एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बॉक्स होते हैं।
  • Output nmsed_scores: एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं।
  • Output nmsed_classes: एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं होती हैं।
  • Output वैलिड_डिटेक्शन: एक [बैच_साइज] int32 टेंसर जो प्रति बैच आइटम वैध डिटेक्शन की संख्या दर्शाता है। nms_boxes[i], nms_scores[i] और nms_class[i] में केवल शीर्ष num_detections[i] प्रविष्टियाँ मान्य हैं। शेष प्रविष्टियाँ शून्य पैडिंग हैं।

निर्माता और विध्वंसक

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

सार्वजनिक गुण

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

सार्वजनिक स्थैतिक कार्य

ClipBoxes (bool x)
PadPerClass (bool x)

संरचनाएँ

टेंसरफ्लो:: ऑप्स:: कंबाइंडनॉनमैक्ससप्रेशन:: एटर्स

CombindNonMaxSuppression के लिए वैकल्पिक विशेषता सेटर्स।

सार्वजनिक गुण

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

संचालन

Operation operation

वैध_डिटेक्शन

::tensorflow::Output valid_detections

सार्वजनिक समारोह

कंबाइंडनॉनमैक्ससप्रेशन

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

कंबाइंडनॉनमैक्ससप्रेशन

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

सार्वजनिक स्थैतिक कार्य

क्लिपबॉक्स

Attrs ClipBoxes(
  bool x
)

पैडपरक्लास

Attrs PadPerClass(
  bool x
)