সেন্সরফ্লো :: অপস :: ননম্যাক্সপ্রেশনভি 5 5

#include <image_ops.h>

লোভজনকভাবে স্কোরের ক্রমবর্ধমান ক্রমে বাউন্ডিং বাক্সগুলির একটি উপসেট নির্বাচন করে ,.

সারসংক্ষেপ

পূর্বের নির্বাচিত বাক্সগুলির সাথে উচ্চ চৌরাস্তা-ওভার-ইউনিয়ন (আইইউ) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই করে। score_threshold চেয়ে কম score_threshold বাউন্ডিং বাক্সগুলি সরানো হবে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্স কোণগুলির যে কোনও তির্যক জোড়ের স্থানাঙ্ক এবং স্থানাঙ্কগুলি সাধারণ হিসাবে সরবরাহ করা যেতে পারে (যেমন, এতে থাকা) বিরতি [0, 1]) বা পরম। নোট করুন যে এই অ্যালগরিদমটি অজিনস্টিক যেখানে উত্স স্থানাঙ্ক সিস্টেমে এবং আরও সাধারণভাবে অরথগোনাল রূপান্তর এবং সমন্বিত সিস্টেমের অনুবাদগুলিতে অদম্য; এইভাবে অনুবাদ বা স্থানাঙ্কের সিস্টেমের প্রতিচ্ছবিগুলির ফলে একই বাক্সগুলি অ্যালগোরিদম দ্বারা নির্বাচিত হয়। এই ক্রিয়াকলাপের আউটপুটটি নির্বাচিত বাক্সগুলিকে উপস্থাপন করে বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহের সাথে ইনডিজিং সংখ্যার একটি সেট। নির্বাচিত সূচকগুলির সাথে সম্পর্কিত বাউন্ডিং বাক্স স্থানাঙ্কগুলি পরে tf.gather operation ব্যবহার করে tf.gather operation । উদাহরণস্বরূপ: নির্বাচিত_ইন্ডিসেস = tf.image.non_max_suppression_v2 (বাক্স, স্কোর, সর্বোচ্চ_আউটপুট_সাইজ, iou_threshold, স্কোর_থ্রেসোল্ড) নির্বাচিত_বক্স = tf.gather (বাক্স, নির্বাচিত_অিনডিস) এই অপশনটি একটি সফট-এনএমএস (গাউসিয়ান ওয়েইটিং সহ) মোড (সিএফ বোদলা এট আল) সমর্থন করে , https://arxiv.org/abs/1704.04503 ) যেখানে বাক্সগুলি সরাসরি ছাঁটাইয়ের পরিবর্তে অন্যান্য ওভারল্যাপিং বাক্সগুলির স্কোরকে হ্রাস করে। এই সফট-এনএমএস মোডটি সক্ষম করতে, soft_nms_sigma প্যারামিটারটিকে 0 এর চেয়ে বড় হতে হবে।

যুক্তি:

  • সুযোগ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকারের একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: প্রতিটি বাক্সের সাথে একক স্কোর (বাক্সগুলির প্রতিটি সারি) উপস্থাপন করে এমন একটি 1-ডি ফ্লোট টেনসর আকার [num_boxes]
  • সর্বোচ্চ_আউটপুট_সাইজ: একটি স্কেলার পূর্ণসংখ্যার টেনসর সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা নন সর্বাধিক দমন দ্বারা নির্বাচিত হবে।
  • iou_threshold: বাক্সগুলি আইওইউর প্রতি শ্রদ্ধার সাথে খুব বেশি ওভারল্যাপ হয় কিনা তা সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
  • স্কোর_থ্রেহোল্ড: স্কোরের ভিত্তিতে বাক্সগুলি কখন সরিয়ে নেওয়ার সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
  • সফট_এনএমএস_সিগমা: সফট এনএমএসের সিগমা প্যারামিটারের প্রতিনিধিত্বকারী একটি 0-ডি ফ্লোট টেনসর; বোদলা এট আল দেখুন (সিএফ https://arxiv.org/abs/1704.04503 )। soft_nms_sigma=0.0 (যা ডিফল্ট), আমরা মানক (হার্ড) soft_nms_sigma=0.0 ফিরে যাই।

Attrs বৈশিষ্ট্য ( Attrs ):

  • প্যাড_টো_ম্যাক্স_আউটপুট_সাইজ: সত্য হলে, selected_indices দৈর্ঘ্য max_output_size জন্য প্যাড করা হয়। মিথ্যাতে ডিফল্ট।

রিটার্নস:

  • Output M <= max_output_size বাক্স M <= max_output_size থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে এমন একটি 1-D পূর্ণসংখ্যক টেনসর [M] , যেখানে M <= max_output_size
  • Output নির্বাচিত_স্কোরগুলি: প্রতিটি নির্বাচিত বাক্সের জন্য সংশ্লিষ্ট স্কোরগুলিকে প্রতিনিধিত্ব করে [M] 1 [M] আকারের একটি 1-ডি ফ্লোট টেনসর, যেখানে M <= max_output_size । সফট এনএমএস ব্যবহার করার সময় স্কোরগুলি কেবলমাত্র সম্পর্কিত ইনপুট স্কোর থেকে পৃথক হয় (যেমন যখন soft_nms_sigma>0 )
  • Output বৈধ_আউটপুট: একটি 0-D পূর্ণসংখ্যা টেনসর বৈধ উপাদানগুলি প্রথম উপস্থিত হওয়ার সাথে সাথে selected_indices বৈধ উপাদানগুলির সংখ্যা উপস্থাপন করে।

নির্মাণকারী এবং ধ্বংসকারী

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

জনসাধারণের গুণাবলী

operation
selected_indices
selected_scores
valid_outputs

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize (bool x)

স্ট্রাক্টস

টেনসরফ্লো :: অপ্স :: ননম্যাক্সসপ্রেশনভি 5 :: অ্যাটার্স

ননম্যাক্সপ্রেসভিশনভি 5 এর জন্য .চ্ছিক অ্যাট্রিবিউট সেটটার

জনসাধারণের গুণাবলী

অপারেশন

Operation operation

নির্বাচিত_অন্ধি

::tensorflow::Output selected_indices

নির্বাচিত_স্কোরগুলি

::tensorflow::Output selected_scores

বৈধ_আউটপুট

::tensorflow::Output valid_outputs

পাবলিক ফাংশন

ননম্যাক্সপ্রেশনভি 5 5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

ননম্যাক্সপ্রেশনভি 5 5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

প্যাডটোম্যাক্স আউটপুট সাইজ

Attrs PadToMaxOutputSize(
  bool x
)