CombinedNonMaxSuppression

সর্বজনীন চূড়ান্ত ক্লাস সম্মিলিত ননম্যাক্স দমন

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে,

এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।

নেস্টেড ক্লাস

ক্লাস সম্মিলিতNonMaxSuppression.Options CombinedNonMaxSuppression এর জন্য ঐচ্ছিক বৈশিষ্ট্য

ধ্রুবক

স্ট্রিং OP_NAME এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

পাবলিক পদ্ধতি

স্ট্যাটিক CombinedNonMaxSuppression.Options
ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)
স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন
তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > বক্স, অপারেন্ড < TFloat32 > স্কোর, অপারেন্ড < TInt32 > maxOutputSizePerClass, অপারেন্ড < TInt32 > maxTotalSize, অপারেন্ড < TFloat32 > iouThreshold, OuThreshold, Operand 32 > অপশন, Operand 32 স্কোর )
একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
আউটপুট < TFloat32 >
nmsedBoxes ()
একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।
আউটপুট < TFloat32 >
nmsed ক্লাস ()
একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।
আউটপুট < TFloat32 >
nmsedস্কোর ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
স্ট্যাটিক CombinedNonMaxSuppression.Options
padPerClass (বুলিয়ান প্যাডপারক্লাস)
আউটপুট < TInt32 >
বৈধ সনাক্তকরণ ()
একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

ধ্রুবক

সর্বজনীন স্ট্যাটিক চূড়ান্ত স্ট্রিং OP_NAME

এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

ধ্রুবক মান: "সম্মিলিত ননম্যাক্স দমন"

পাবলিক পদ্ধতি

সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন । বিকল্প ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)

পরামিতি
ক্লিপবক্স সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং আউটপুট বাক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে যায়। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না।

সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > বক্স, অপারেন্ড < TFloat32 > স্কোর, অপারেন্ড < TInt32 > maxOutputSizePerClass, অপারেন্ড < TInt32 > maxTotalSize, <Floouath3 এবং > Operand 2 > Operand স্কোর থ্রেশহোল্ড, বিকল্প... বিকল্প)

একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
বাক্স আকৃতির একটি 4-D ফ্লোট টেনসর `[ব্যাচ_সাইজ, সংখ্যা_বক্স, q, 4]`। যদি `q` 1 হয় তাহলে একই বক্স সব শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি `q` ক্লাসের সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্স ব্যবহার করা হয়।
স্কোর একটি 3-D ফ্লোট টেনসর আকৃতি `[batch_size, num_boxes, num_classes]` প্রতিটি বাক্সের (বাক্সের প্রতিটি সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে।
maxOutputSizePerClass একটি স্কেলার পূর্ণসংখ্যা টেনসর যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচিত সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে
সর্বোচ্চ মোট আকার একটি স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে।
iouThreshold একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
স্কোর থ্রেশহোল্ড একটি 0-D ফ্লোট টেনসর যা স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • CombinedNonMaxSuppression এর একটি নতুন উদাহরণ

সর্বজনীন আউটপুট < TFloat32 > nmsedBoxes ()

একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।

সর্বজনীন আউটপুট < TFloat32 > nmsedClasses ()

একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।

সর্বজনীন আউটপুট < TFloat32 > nmsedScores ()

একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।

পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options padPerClass (বুলিয়ান প্যাডপারক্লাস)

পরামিতি
padPerClass মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় `max_total_size`-এ। যদি সত্য হয়, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্য `max_size_per_class`*`num_classes` এর জন্য প্যাড করা হয়, যদি না এটি `max_total_size` অতিক্রম করে যে ক্ষেত্রে এটি `max_total_size` এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা.

সর্বজনীন আউটপুট < TInt32 > validDetections ()

একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র উপরের num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.