CombinedNonMaxSuppression

পাবলিক চূড়ান্ত বর্গ CombinedNonMaxSuppression

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে,

এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। পূর্বে নির্বাচিত বাক্সগুলির সাথে উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression সম্পাদন করার পরে ফিরে আসে।

নেস্টেড ক্লাস

ক্লাস সম্মিলিতNonMaxSuppression.Options জন্য ঐচ্ছিক বৈশিষ্ট্য CombinedNonMaxSuppression

পাবলিক পদ্ধতি

স্ট্যাটিক CombinedNonMaxSuppression.Options
clipBoxes (বুলিয়ান clipBoxes)
স্ট্যাটিক CombinedNonMaxSuppression
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <ফ্লোট> বক্স, প্রতীক <ফ্লোট> স্কোর, প্রতীক <integer> maxOutputSizePerClass, প্রতীক <integer> maxTotalSize, প্রতীক <ফ্লোট> iouThreshold, প্রতীক <ফ্লোট> scoreThreshold, বিকল্পসমূহ ... অপশন)
একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
আউটপুট <ফ্লোট>
nmsedBoxes ()
একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।
আউটপুট <ফ্লোট>
nmsedClasses ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির জন্য ক্লাস থাকে।
আউটপুট <ফ্লোট>
nmsedScores ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
স্ট্যাটিক CombinedNonMaxSuppression.Options
padPerClass (বুলিয়ান padPerClass)
আউটপুট <integer>
validDetections ()
একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options clipBoxes (বুলিয়ান clipBoxes)

পরামিতি
ক্লিপবক্স সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে এবং আউটপুট বাক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না।

পাবলিক স্ট্যাটিক CombinedNonMaxSuppression তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <ফ্লোট> বক্স, প্রতীক <ফ্লোট> স্কোর, প্রতীক <integer> maxOutputSizePerClass, প্রতীক <integer> maxTotalSize, প্রতীক <ফ্লোট> iouThreshold, প্রতীক <ফ্লোট> scoreThreshold, বিকল্পসমূহ ... অপশন)

একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
বাক্স আকৃতির একটি 4-D ফ্লোট টেনসর `[ব্যাচ_সাইজ, সংখ্যা_বক্স, q, 4]`। যদি `q` 1 হয় তাহলে একই বক্স সব শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি `q` ক্লাসের সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্স ব্যবহার করা হয়।
স্কোর একটি 3-D ফ্লোট টেনসর আকৃতি `[batch_size, num_boxes, num_classes]` প্রতিটি বাক্সের সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে (বাক্সের প্রতিটি সারি)।
maxOutputSizePerClass একটি স্কেলার পূর্ণসংখ্যা টেনসর যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচিত সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে
সর্বোচ্চ মোট আকার একটি int32 স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বক্সের প্রতিনিধিত্ব করে। মনে রাখবেন যে এই মানটিকে একটি বড় সংখ্যায় সেট করার ফলে সিস্টেমের কাজের চাপের উপর নির্ভর করে OOM ত্রুটি হতে পারে।
iouThreshold একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
স্কোর থ্রেশহোল্ড একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • CombinedNonMaxSuppression এর একটি নতুন উদাহরণ

পাবলিক আউটপুট <ফ্লোট> nmsedBoxes ()

একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।

পাবলিক আউটপুট <ফ্লোট> nmsedClasses ()

একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির জন্য ক্লাস থাকে।

পাবলিক আউটপুট <ফ্লোট> nmsedScores ()

একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।

পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options padPerClass (বুলিয়ান padPerClass)

পরামিতি
padPerClass মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় `max_total_size`-এ। সত্য হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্যের 'max_size_per_class'*`num_classes' এর জন্য প্যাড করা হয়, যদি না এটি `max_total_size` অতিক্রম করে যে ক্ষেত্রে এটি `max_total_size` এ ক্লিপ করা হয়। মিথ্যা থেকে ডিফল্ট.

পাবলিক আউটপুট <integer> validDetections ()

একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র শীর্ষ num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.