यह ऑप arXiv:1506.01497 में eq.2 के अनुसार दिए गए बाउंडिंग बॉक्स (bbox_deltas) एन्कोडेड wrt एंकर से रुचियों का क्षेत्र तैयार करता है।
ऑप शीर्ष `pre_nms_topn` स्कोरिंग बॉक्स का चयन करता है, उन्हें एंकरों के संबंध में डिकोड करता है, `nms_threshold` इंटरसेक्शन-ओवर-यूनियन (iou) मान से अधिक वाले ओवरलैपिंग बॉक्स पर गैर-अधिकतम दमन लागू करता है, उन बॉक्स को हटा देता है जहां छोटा पक्ष `से कम है min_size`. इनपुट: `स्कोर`: आकार का एक 4D टेंसर [बैच, ऊंचाई, चौड़ाई, संख्या एंकर] जिसमें दिए गए स्थान पर प्रति एंकर स्कोर शामिल है `bbox_deltas`: आकार का एक टेंसर है [बैच, ऊंचाई, चौड़ाई, 4 x संख्या एंकर] प्रत्येक एंकर `एंकर` के लिए एन्कोड किए गए बॉक्स: आकार का एक 1डी टेंसर [4 x संख्या एंकर], जो एंकर का प्रतिनिधित्व करता है। आउटपुट: `rois`: आउटपुट RoIs, आकार का एक 3D टेंसर [बैच, post_nms_topn, 4], यदि post_nms_topn से कम उम्मीदवार मिले तो 0 से गद्देदार। `roi_probability`: 'rois' में प्रत्येक roi का संभाव्यता स्कोर, आकार का एक 2D टेंसर [बैच, पोस्ट_nms_topn], यदि आवश्यक हो तो 0 के साथ गद्देदार, स्कोर के अनुसार क्रमबद्ध।
नेस्टेड क्लासेस
कक्षा | बाउंडिंगबॉक्सप्रस्ताव.विकल्प जेनरेट करें | GenerateBoundingBoxProposals के लिए वैकल्पिक विशेषताएँ |
सार्वजनिक तरीके
स्थिर जेनरेटबाउंडिंगबॉक्सप्रस्ताव | |
स्थिर जेनरेटबाउंडिंगबॉक्सप्रस्ताव.विकल्प | पोस्टएनएमटॉपएन (लंबा पोस्टएनएमटॉपएन) |
आउटपुट <फ्लोट> | आरओआईसंभावनाएँ () `[num_images, post_nms_topn]` आकार का एक 2-डी फ्लोट टेंसर उसी सूचकांक पर `rois` टेंसर में रुचि बॉक्स के क्षेत्र के स्कोर का प्रतिनिधित्व करता है। |
आउटपुट <फ्लोट> | रोइस () `[num_images,post_nms_topn,4]` आकार का एक 3-डी फ्लोट टेंसर रुचि बक्सों के चयनित क्षेत्र का प्रतिनिधित्व करता है। |
विरासत में मिली विधियाँ
सार्वजनिक तरीके
सार्वजनिक स्थैतिक जेनरेटबाउंडिंगबॉक्सप्रस्ताव बनाते हैं ( स्कोप स्कोप, ऑपरेंड <फ्लोट> स्कोर, ऑपरेंड <फ्लोट> bboxDeltas, ऑपरेंड <फ्लोट> इमेजइन्फो, ऑपरेंड <फ्लोट> एंकर, ऑपरेंड <फ्लोट> एनएमएसथ्रेशोल्ड, ऑपरेंड <इंटेगर> प्रीएनएमएसटॉपन, ऑपरेंड <फ्लोट> मिनसाइज, विकल्प... विकल्प)
एक नया GenerateBoundingBoxProposals ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
पैरामीटर
दायरा | वर्तमान दायरा |
---|---|
स्कोर | `[num_images, ऊँचाई, चौड़ाई, num_achors]` आकार का एक 4-डी फ़्लोट टेंसर जिसमें दिए गए एंकरों के लिए बक्सों के स्कोर होते हैं, को अनसॉर्ट किया जा सकता है। |
bboxDeltas | `[num_images, ऊँचाई, चौड़ाई, 4 x num_anchors]` आकार का एक 4-डी फ्लोट टेंसर। प्रत्येक एंकर के संबंध में एन्कोडिंग बॉक्स। निर्देशांक [dy, dx, dh, dw] रूप में दिए गए हैं। |
छवि जानकारी | `[num_images, 5]` आकार का एक 2-डी फ्लोट टेंसर जिसमें छवि जानकारी ऊंचाई, चौड़ाई, स्केल शामिल है। |
एंकर | एंकर बॉक्स का वर्णन करने वाले `[num_anchors, 4]` आकार का 2-डी फ्लोट टेंसर। बक्सों को [y1, x1, y2, x2] रूप में स्वरूपित किया गया है। |
nmsसीमा | गैर-अधिकतम-दमन सीमा के लिए एक स्केलर फ्लोट टेंसर। |
preNmsTopn | इनपुट के रूप में उपयोग किए जाने वाले शीर्ष स्कोरिंग बॉक्स की संख्या के लिए एक स्केलर इंट टेंसर। |
छोटा आकार | एक अदिश फ्लोट टेंसर। कोई भी बॉक्स जिसका आकार min_size से छोटा है, उसे त्याग दिया जाएगा। |
विकल्प | वैकल्पिक गुण मान रखता है |
रिटर्न
- GenerateBoundingBoxProposals का एक नया उदाहरण
सार्वजनिक स्थैतिक जेनरेटबाउंडिंगबॉक्सप्रस्ताव.विकल्प पोस्टएनएमटॉपएन (लंबा पोस्टएनएमटॉपएन)
पैरामीटर
पोस्टएनएमएसटॉपएन | पूर्णांक। आउटपुट में rois की अधिकतम संख्या. |
---|
सार्वजनिक आउटपुट <फ़्लोट> roiसंभावनाएँ ()
`[num_images, post_nms_topn]` आकार का एक 2-डी फ्लोट टेंसर उसी सूचकांक पर `rois` टेंसर में रुचि बॉक्स के क्षेत्र के स्कोर का प्रतिनिधित्व करता है।
सार्वजनिक आउटपुट <फ्लोट> रोइस ()
`[num_images,post_nms_topn,4]` आकार का एक 3-डी फ्लोट टेंसर रुचि बक्सों के चयनित क्षेत्र का प्रतिनिधित्व करता है। अंकों में अवरोही क्रम में क्रमबद्ध।