Google I/O-তে টিউন করার জন্য ধন্যবাদ। চাহিদা অনুযায়ী সব সেশন দেখুন চাহিদা অনুযায়ী দেখুন

সেন্সরফ্লো :: অপস :: ননম্যাক্সপ্রেশনভি 4

#include <image_ops.h>

লোভজনকভাবে স্কোরের ক্রমবর্ধমান ক্রমে বাউন্ডিং বাক্সগুলির একটি উপসেট নির্বাচন করে ,.

সারসংক্ষেপ

পূর্বের নির্বাচিত বাক্সগুলির সাথে উচ্চ চৌরাস্তা-ওভার-ইউনিয়ন (আইইউ) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই করে। score_threshold চেয়ে কম score_threshold বাউন্ডিং বাক্সগুলি সরানো হবে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্স কোণগুলির যে কোনও তির্যক জোড়ের স্থানাঙ্ক এবং স্থানাঙ্কগুলি সাধারণ হিসাবে সরবরাহ করা যেতে পারে (যেমন, এতে থাকা) বিরতি [0, 1]) বা পরম। নোট করুন যে এই অ্যালগরিদমটি অজিনস্টিক যেখানে মূল স্থানাঙ্ক পদ্ধতিতে রয়েছে এবং আরও সাধারণভাবে অরথোগোনাল রূপান্তর ও স্থানাঙ্ক ব্যবস্থার অনুবাদগুলিতে অদ্বিতীয়; এইভাবে অনুবাদ বা স্থানাঙ্কের সিস্টেমের প্রতিচ্ছবিগুলির ফলে একই বাক্সগুলি অ্যালগোরিদম দ্বারা নির্বাচিত হয়। এই ক্রিয়াকলাপের আউটপুটটি নির্বাচিত বাক্সগুলিকে উপস্থাপন করে বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহের সাথে ইনডিজিং সংখ্যার একটি সেট। নির্বাচিত সূচকগুলির সাথে সম্পর্কিত বাউন্ডিং বক্স স্থানাঙ্কগুলি tf.gather operation ব্যবহার করে প্রাপ্ত করা যেতে পারে। উদাহরণস্বরূপ: নির্বাচিত_ইন্ডিসগুলি = tf.image.non_max_suppression_v2 (বাক্স, স্কোর, সর্বোচ্চ_আউটপুট_সাইজ, iou_threshold, স্কোর_থ্রেসোল্ড) নির্বাচিত_বক্সগুলি = tf.gather (বাক্স, নির্বাচিত_ইন্ডিস)

যুক্তি:

  • সুযোগ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকারের একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: প্রতিটি বাক্সের সাথে একক স্কোর (বাক্সগুলির প্রতিটি সারি) উপস্থাপন করে এমন একটি 1-ডি ফ্লোট টেনসর আকার [num_boxes]
  • সর্বোচ্চ_আউটপুট_সাইজ: একটি স্কেলার পূর্ণসংখ্যার টেনসর সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা নন সর্বাধিক দমন দ্বারা নির্বাচিত হবে।
  • iou_threshold: বাক্সগুলি আইওইউর প্রতি শ্রদ্ধার সাথে খুব বেশি ওভারল্যাপ হয় কিনা তা সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
  • স্কোর_থ্রেহোল্ড: স্কোরের ভিত্তিতে বাক্সগুলি কখন সরিয়ে নেওয়ার সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।

Attrs বৈশিষ্ট্য ( Attrs ):

  • প্যাড_টো_ম্যাক্স_আউটপুট_সাইজ: সত্য হলে, selected_indices দৈর্ঘ্য max_output_size জন্য প্যাড করা হয়। মিথ্যাতে ডিফল্ট।

রিটার্নস:

  • Output M <= max_output_size বাক্স M <= max_output_size থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে এমন একটি 1-D পূর্ণসংখ্যক টেনসর [M] , যেখানে M <= max_output_size
  • Output বৈধ_আউটপুট: একটি 0-D পূর্ণসংখ্যা টেনসর বৈধ উপাদানগুলি প্রথম উপস্থিত হওয়ার সাথে সাথে selected_indices বৈধ উপাদানগুলির সংখ্যা উপস্থাপন করে।

নির্মাণকারী এবং ধ্বংসকারী

NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const NonMaxSuppressionV4::Attrs & attrs)

জনসাধারণের গুণাবলী

operation
selected_indices
valid_outputs

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize (bool x)

স্ট্রাক্টস

টেনসরফ্লো :: অপ্স :: ননম্যাক্সসপ্রেশনভি 4 :: অ্যাটার্স

ননম্যাক্সপ্রেসভিশনভি 4 এর জন্য .চ্ছিক অ্যাট্রিবিউট সেটটার

জনসাধারণের গুণাবলী

অপারেশন

Operation operation

নির্বাচিত_অন্ধি

::tensorflow::Output selected_indices

বৈধ_আউটপুট

::tensorflow::Output valid_outputs

পাবলিক ফাংশন

ননম্যাক্সপ্রেশনভি 4

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

ননম্যাক্সপ্রেশনভি 4

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const NonMaxSuppressionV4::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

প্যাডটোম্যাক্স আউটপুট সাইজ

Attrs PadToMaxOutputSize(
  bool x
)