সেন্সরফ্লো :: অপস :: ননম্যাক্সপ্রেসভিশনভি 3

#include <image_ops.h>

লোভজনকভাবে স্কোরের ক্রমবর্ধমান ক্রমে বাউন্ডিং বাক্সগুলির একটি উপসেট নির্বাচন করে ,.

সারসংক্ষেপ

পূর্বের নির্বাচিত বাক্সগুলির সাথে উচ্চ চৌরাস্তা-ওভার-ইউনিয়ন (আইইউ) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই করে। score_threshold চেয়ে কম score_threshold বাউন্ডিং বাক্সগুলি সরানো হবে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্স কোণগুলির যে কোনও তির্যক জোড়ের স্থানাঙ্ক এবং স্থানাঙ্কগুলি সাধারণ হিসাবে সরবরাহ করা যেতে পারে (যেমন, এতে থাকা) বিরতি [0, 1]) বা পরম। নোট করুন যে এই অ্যালগরিদমটি অজিনস্টিক যেখানে উত্স স্থানাঙ্ক সিস্টেমে এবং আরও সাধারণভাবে অরথোগোনাল রূপান্তর এবং সমন্বিত সিস্টেমের অনুবাদগুলিতে অদ্বিতীয়; এইভাবে অনুবাদ বা স্থানাঙ্কের সিস্টেমের প্রতিচ্ছবিগুলির ফলে একই বাক্সগুলি অ্যালগোরিদম দ্বারা নির্বাচিত হয়। এই ক্রিয়াকলাপের আউটপুটটি নির্বাচিত বাক্সগুলিকে উপস্থাপন করে বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহের সাথে ইনডিজিং সংখ্যার একটি সেট। নির্বাচিত সূচকগুলির সাথে সম্পর্কিত বাউন্ডিং বাক্স স্থানাঙ্কগুলি পরে tf.gather operation ব্যবহার করে tf.gather operation । উদাহরণস্বরূপ: নির্বাচিত_ইন্ডিসগুলি = tf.image.non_max_suppression_v2 (বাক্স, স্কোর, সর্বোচ্চ_আউটপুট_সাইজ, iou_threshold, স্কোর_থ্রেসোল্ড) নির্বাচিত_বক্সেস = tf.gather (বাক্স, নির্বাচিত_অিনডিস)

যুক্তি:

  • সুযোগ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকারের একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: প্রতিটি বাক্সের সাথে একক স্কোর (বাক্সগুলির প্রতিটি সারি) উপস্থাপন করে এমন একটি 1-ডি ফ্লোট টেনসর আকার [num_boxes]
  • সর্বোচ্চ_আউটপুট_সাইজ: একটি স্কেলার পূর্ণসংখ্যার টেনসর সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা নন সর্বাধিক দমন দ্বারা নির্বাচিত হবে।
  • iou_threshold: বাক্সগুলি আইওইউর প্রতি শ্রদ্ধার সাথে খুব বেশি ওভারল্যাপ হয় কিনা তা সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
  • স্কোর_থ্রেহোল্ড: স্কোরের ভিত্তিতে বাক্সগুলি কখন সরিয়ে নেওয়ার সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।

রিটার্নস:

  • Output : বাক্স টেন্সর থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে এমন একটি 1-D পূর্ণসংখ্যক টেনসর [M] , যেখানে M <= max_output_size

নির্মাণকারী এবং ধ্বংসকারী

NonMaxSuppressionV3 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)

জনসাধারণের গুণাবলী

operation
selected_indices

পাবলিক ফাংশন

node () const
::tensorflow::Node *
operator::tensorflow::Input () const
operator::tensorflow::Output () const

জনসাধারণের গুণাবলী

অপারেশন

Operation operation

নির্বাচিত_অন্ধি

::tensorflow::Output selected_indices

পাবলিক ফাংশন

ননম্যাক্সপ্রেসভিশনভি 3

 NonMaxSuppressionV3(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

নোড

::tensorflow::Node * node() const 

অপারেটর :: টেনসরফ্লো :: ইনপুট

 operator::tensorflow::Input() const 

অপারেটর :: টেনসরফ্লো :: আউটপুট

 operator::tensorflow::Output() const