লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে,
এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।
নেস্টেড ক্লাস
ক্লাস | সম্মিলিতNonMaxSuppression.Options | CombinedNonMaxSuppression এর জন্য ঐচ্ছিক বৈশিষ্ট্য |
পাবলিক পদ্ধতি
স্ট্যাটিক CombinedNonMaxSuppression.Options | ক্লিপবক্স (বুলিয়ান ক্লিপবক্স) |
স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন | তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <ফ্লোট> বক্স, অপারেন্ড <ফ্লোট> স্কোর, অপারেন্ড <পূর্ণসংখ্যা> maxOutputSizePerClass, Operand <Integer> maxTotalSize, Operand <Float> iouThreshold, Operand <Float> স্কোর থ্রেশহোল্ড, বিকল্পগুলি ... ) একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি। |
আউটপুট <ফ্লোট> | nmsedBoxes () একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে। |
আউটপুট <ফ্লোট> | nmsed ক্লাস () একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে। |
আউটপুট <ফ্লোট> | nmsedস্কোর () একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে। |
স্ট্যাটিক CombinedNonMaxSuppression.Options | padPerClass (বুলিয়ান প্যাডপারক্লাস) |
আউটপুট <পূর্ণসংখ্যা> | বৈধ সনাক্তকরণ () একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। |
উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি
পাবলিক পদ্ধতি
সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন । বিকল্প ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)
পরামিতি
ক্লিপবক্স | সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং আউটপুট বাক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে যায়। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না। |
---|
সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <ফ্লোট> বক্স, অপারেন্ড <ফ্লোট> স্কোর, অপারেন্ড <পূর্ণসংখ্যা > maxOutputSizePerClass, অপারেন্ড <Integer> maxTotalSize, Operand <ফ্লোট> iouThreshold> বিকল্প, <Threshold> অপশন , অপারেন্ড লোড...
একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
পরামিতি
সুযোগ | বর্তমান সুযোগ |
---|---|
বাক্স | আকৃতির একটি 4-D ফ্লোট টেনসর `[ব্যাচ_সাইজ, সংখ্যা_বক্স, q, 4]`। যদি `q` 1 হয় তাহলে একই বক্স সব শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি `q` ক্লাসের সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্স ব্যবহার করা হয়। |
স্কোর | একটি 3-D ফ্লোট টেনসর আকৃতি `[batch_size, num_boxes, num_classes]` প্রতিটি বাক্সের (বাক্সের প্রতিটি সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে। |
maxOutputSizePerClass | একটি স্কেলার পূর্ণসংখ্যা টেনসর যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচিত সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে |
সর্বোচ্চ মোট আকার | একটি স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে। |
iouThreshold | একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷ |
স্কোর থ্রেশহোল্ড | একটি 0-D ফ্লোট টেনসর যা স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷ |
বিকল্প | ঐচ্ছিক বৈশিষ্ট্য মান বহন করে |
রিটার্নস
- CombinedNonMaxSuppression এর একটি নতুন উদাহরণ
সর্বজনীন আউটপুট <ফ্লোট> nmsedBoxes ()
একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।
সর্বজনীন আউটপুট <ফ্লোট> nmsedClasses ()
একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।
সর্বজনীন আউটপুট <ফ্লোট> nmsedScores ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options padPerClass (বুলিয়ান প্যাডপারক্লাস)
পরামিতি
padPerClass | মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় `max_total_size`-এ। সত্য হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্যের 'max_size_per_class'*`num_classes' এর জন্য প্যাড করা হয়, যদি না এটি `max_total_size` অতিক্রম করে যে ক্ষেত্রে এটি `max_total_size` এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা. |
---|
সর্বজনীন আউটপুট <Integer> validDetections ()
একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র উপরের num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.