সেন্সরফ্লো :: অপস :: সম্মিলিতনম্যাক্সপ্রেসেশন
#include <image_ops.h>
লোভজনকভাবে স্কোরের ক্রমবর্ধমান ক্রমে বাউন্ডিং বাক্সগুলির একটি উপসেট নির্বাচন করে ,.
সারসংক্ষেপ
এই ক্রিয়াকলাপটি সমস্ত ক্লাস জুড়ে প্রতি ব্যাচে ইনপুটগুলিতে অ_ম্যাক্স_সম্প্রেশন সম্পাদন করে। পূর্বের নির্বাচিত বাক্সগুলির সাথে উচ্চ চৌরাস্তা-ওভার-ইউনিয়ন (আইইউ) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই করে দেয়। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্স কোণগুলির যে কোনও তির্যক জোড়ের স্থানাঙ্ক এবং স্থানাঙ্কগুলি সাধারণ হিসাবে সরবরাহ করা যেতে পারে (যেমন, এতে থাকা) বিরতি [0, 1]) বা পরম। নোট করুন যে এই অ্যালগরিদমটি অজিনস্টিক যেখানে মূল স্থানাঙ্ক পদ্ধতিতে রয়েছে। আরও মনে রাখবেন যে এই অ্যালগরিদমটি গৌণ রূপান্তর ও সমন্বিত সিস্টেমের অনুবাদগুলিতে অদলবদল; এইভাবে অনুবাদ বা স্থানাঙ্কের সিস্টেমের প্রতিচ্ছবিগুলির ফলে একই বাক্সগুলি অ্যালগোরিদম দ্বারা নির্বাচিত হয়। এই অপারেশনের আউটপুট হ'ল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর নন_ম্যাক্স_সপ্রেশন করার পরে ফিরে আসে।
যুক্তি:
- সুযোগ: একটি স্কোপ অবজেক্ট
- বাক্স: আকারের একটি 4-ডি ফ্লোট টেনসর
[batch_size, num_boxes, q, 4]
। যদিq
1 হয় তবে সমস্ত বক্সের জন্য একই বাক্সগুলি ব্যবহার করা হবে অন্যথায়,q
শ্রেণীর সংখ্যার সমান হলে, শ্রেণি-নির্দিষ্ট বাক্সগুলি ব্যবহৃত হয়। - স্কোর: প্রতিটি বাক্সের (বক্সের প্রতিটি সারি) এর সাথে সম্পর্কিত একক স্কোরকে উপস্থাপনকারী
[batch_size, num_boxes, num_classes]
আকারের একটি 3-ডি ফ্লোট টেনসর। - সর্বোচ্চ_আউটপুট_সাইজ_পার_ক্লাস: একটি শ্রেণিবদ্ধ পূর্ণসংখ্যক টেনসর সর্বোচ্চ ক্লাসে প্রতি ক্লাসে অ সর্বাধিক দমন দ্বারা নির্বাচিত হওয়া সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে
- সর্বোচ্চ_টোটাল_সাইজ: সমস্ত শ্রেণীর উপর ধরে থাকা সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্বকারী একটি স্কেলার।
- iou_threshold: বাক্সগুলি আইওইউর প্রতি শ্রদ্ধার সাথে খুব বেশি ওভারল্যাপ হয় কিনা তা সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
- স্কোর_থ্রেহোল্ড: স্কোরের ভিত্তিতে বাক্সগুলি কখন সরিয়ে নেওয়ার সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
- প্যাড_পার_ক্লাস: মিথ্যা হলে, আউটপুট এনএমএস করা বাক্স, স্কোর এবং ক্লাস
max_total_size
/max_total_size
ক্লিপ করাmax_total_size
। যদি সত্য হয় তবে আউটপুট এনএমএস করা বাক্স, স্কোর এবং ক্লাসগুলিmax_size_per_class
*num_classes
max_size_per_class
num_classes
হবে যদি না এটিmax_total_size
সংখ্যাmax_total_size
ছাড়িয়েmax_total_size
তবে এটিmax_total_size
ক্লিপড নাmax_total_size
। মিথ্যা ডিফল্ট। - ক্লিপ_বক্স: সত্য হলে, ধরে নিন যে বাক্সের স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং যদি আউটপুট বাক্সগুলি [0, 1] এর বাইরে চলে যায় তবে ক্লিপ করুন। যদি মিথ্যা হয়, ক্লিপিং করবেন না এবং বাক্সটি যেমন স্থানাঙ্ক আউটপুট দেয় তেমন করে।
রিটার্নস:
-
Output
nmsed_boxes: একটি [ব্যাচ_সাইজ, সর্বাধিক_বিজ্ঞাপন, 4] নন-সর্বাধিক চাপা বাক্সযুক্ত ফ্লোট 32 টেনसर or -
Output
এনএমসিড_স্কোর: বাক্সগুলির জন্য স্কোর সমেত একটি [ব্যাচ_সাইজ, ম্যাক্স_ডিটেকশনস] ফ্লোট 32 টেন্সর। -
Output
এনএমএসড_ক্ল্যাসেস: একটি [ব্যাচ_সাইজ, ম্যাক্স_ডিটেকশনস] বক্সগুলির জন্য ক্লাস সমেত একটি ফ্লোট 32 টেনसर। -
Output
বৈধ_শক্তি: ব্যাচ আইটেম প্রতি বৈধ সনাক্তকরণের সংখ্যা ইঙ্গিত করে একটি [ব্যাচ_সাইজ] ইন্ট 32 টেন্সর। কেবলমাত্র এনএমএস_বক্স [i], এনএমএস_স্কোর [i] এবং এনএমএস_ক্ল্যাজে [শীর্ষ] নাম্বারগুলি [i] বৈধ। বাকি এন্ট্রিগুলি শূন্য প্যাডিংস।
নির্মাণকারী এবং ধ্বংসকারী | |
---|---|
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs) |
জনসাধারণের গুণাবলী | |
---|---|
nmsed_boxes | |
nmsed_classes | |
nmsed_scores | |
operation | |
valid_detections |
পাবলিক স্ট্যাটিক ফাংশন | |
---|---|
ClipBoxes (bool x) | |
PadPerClass (bool x) |
স্ট্রাক্টস | |
---|---|
টেনসরফ্লো :: অপ্স :: কম্বাইন্ডননম্যাক্সপ্রপ্রেশন :: অ্যাটার্স | কম্বাইন্ডননম্যাক্সসপ্রেশনের জন্য ptionচ্ছিক অ্যাট্রিবিউট সেটটার। |
জনসাধারণের গুণাবলী
nmsed_boxes
::tensorflow::Output nmsed_boxes
nmsed_class
::tensorflow::Output nmsed_classes
nmsed_scores
::tensorflow::Output nmsed_scores
অপারেশন
Operation operation
বৈধ_শক্তি
028 বি 3 এফি 0পাবলিক ফাংশন
সম্মিলিতনম্যাক্সপ্রেসেশন
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
সম্মিলিতনম্যাক্সপ্রেসেশন
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs )
পাবলিক স্ট্যাটিক ফাংশন
ক্লিপবক্সস
Attrs ClipBoxes( bool x )
প্যাডক্লাস
Attrs PadPerClass( bool x )