Google I/O-তে টিউন করার জন্য ধন্যবাদ। চাহিদা অনুযায়ী সব সেশন দেখুন চাহিদা অনুযায়ী দেখুন

সেন্সরফ্লো :: অপস :: সম্মিলিতনম্যাক্সপ্রেসেশন

#include <image_ops.h>

লোভজনকভাবে স্কোরের ক্রমবর্ধমান ক্রমে বাউন্ডিং বাক্সগুলির একটি উপসেট নির্বাচন করে ,.

সারসংক্ষেপ

এই ক্রিয়াকলাপটি সমস্ত ক্লাস জুড়ে প্রতি ব্যাচে ইনপুটগুলিতে অ_ম্যাক্স_সম্প্রেশন সম্পাদন করে। পূর্বের নির্বাচিত বাক্সগুলির সাথে উচ্চ চৌরাস্তা-ওভার-ইউনিয়ন (আইইউ) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই করে দেয়। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্স কোণগুলির যে কোনও তির্যক জোড়ের স্থানাঙ্ক এবং স্থানাঙ্কগুলি সাধারণ হিসাবে সরবরাহ করা যেতে পারে (যেমন, এতে থাকা) বিরতি [0, 1]) বা পরম। নোট করুন যে এই অ্যালগরিদমটি অজিনস্টিক যেখানে মূল স্থানাঙ্ক পদ্ধতিতে রয়েছে। আরও মনে রাখবেন যে এই অ্যালগরিদমটি গৌণ রূপান্তর ও সমন্বিত সিস্টেমের অনুবাদগুলিতে অদলবদল; এইভাবে অনুবাদ বা স্থানাঙ্কের সিস্টেমের প্রতিচ্ছবিগুলির ফলে একই বাক্সগুলি অ্যালগোরিদম দ্বারা নির্বাচিত হয়। এই অপারেশনের আউটপুট হ'ল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর নন_ম্যাক্স_সপ্রেশন করার পরে ফিরে আসে।

যুক্তি:

  • সুযোগ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকারের একটি 4-ডি ফ্লোট টেনসর [batch_size, num_boxes, q, 4] । যদি q 1 হয় তবে সমস্ত বক্সের জন্য একই বাক্সগুলি ব্যবহার করা হবে অন্যথায়, q শ্রেণীর সংখ্যার সমান হলে, শ্রেণি-নির্দিষ্ট বাক্সগুলি ব্যবহৃত হয়।
  • স্কোর: প্রতিটি বাক্সের (বক্সের প্রতিটি সারি) এর সাথে সম্পর্কিত একক স্কোরকে উপস্থাপনকারী [batch_size, num_boxes, num_classes] আকারের একটি 3-ডি ফ্লোট টেনসর।
  • সর্বোচ্চ_আউটপুট_সাইজ_পার_ক্লাস: একটি শ্রেণিবদ্ধ পূর্ণসংখ্যক টেনসর সর্বোচ্চ ক্লাসে প্রতি ক্লাসে অ সর্বাধিক দমন দ্বারা নির্বাচিত হওয়া সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে
  • সর্বোচ্চ_টোটাল_সাইজ: সমস্ত শ্রেণীর উপর ধরে থাকা সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্বকারী একটি স্কেলার।
  • iou_threshold: বাক্সগুলি আইওইউর প্রতি শ্রদ্ধার সাথে খুব বেশি ওভারল্যাপ হয় কিনা তা সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।
  • স্কোর_থ্রেহোল্ড: স্কোরের ভিত্তিতে বাক্সগুলি কখন সরিয়ে নেওয়ার সিদ্ধান্ত নেওয়ার জন্য প্রান্তিক প্রতিনিধিত্বকারী একটি 0-ডি ফ্ল্যাট টেনসর।

Attrs বৈশিষ্ট্য ( Attrs ):

  • প্যাড_পার_ক্লাস: মিথ্যা হলে, আউটপুট এনএমএস করা বাক্স, স্কোর এবং ক্লাস max_total_size / max_total_size ক্লিপ করা max_total_size । যদি সত্য হয় তবে আউটপুট এনএমএস করা বাক্স, স্কোর এবং ক্লাসগুলি max_size_per_class * num_classes max_size_per_class num_classes হবে যদি না এটি max_total_size সংখ্যা max_total_size ছাড়িয়ে max_total_size তবে এটি max_total_size ক্লিপড না max_total_size । মিথ্যা ডিফল্ট।
  • ক্লিপ_বক্স: সত্য হলে, ধরে নিন যে বাক্সের স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং যদি আউটপুট বাক্সগুলি [0, 1] এর বাইরে চলে যায় তবে ক্লিপ করুন। যদি মিথ্যা হয়, ক্লিপিং করবেন না এবং বাক্সটি যেমন স্থানাঙ্ক আউটপুট দেয় তেমন করে।

রিটার্নস:

  • Output nmsed_boxes: একটি [ব্যাচ_সাইজ, সর্বাধিক_বিজ্ঞাপন, 4] নন-সর্বাধিক চাপা বাক্সযুক্ত ফ্লোট 32 টেনसर or
  • Output এনএমসিড_স্কোর: বাক্সগুলির জন্য স্কোর সমেত একটি [ব্যাচ_সাইজ, ম্যাক্স_ডিটেকশনস] ফ্লোট 32 টেন্সর।
  • Output এনএমএসড_ক্ল্যাসেস: একটি [ব্যাচ_সাইজ, ম্যাক্স_ডিটেকশনস] বক্সগুলির জন্য ক্লাস সমেত একটি ফ্লোট 32 টেনसर।
  • Output বৈধ_শক্তি: ব্যাচ আইটেম প্রতি বৈধ সনাক্তকরণের সংখ্যা ইঙ্গিত করে একটি [ব্যাচ_সাইজ] ইন্ট 32 টেন্সর। কেবলমাত্র এনএমএস_বক্স [i], এনএমএস_স্কোর [i] এবং এনএমএস_ক্ল্যাজে [শীর্ষ] নাম্বারগুলি [i] বৈধ। বাকি এন্ট্রিগুলি শূন্য প্যাডিংস।

নির্মাণকারী এবং ধ্বংসকারী

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

জনসাধারণের গুণাবলী

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

পাবলিক স্ট্যাটিক ফাংশন

ClipBoxes (bool x)
PadPerClass (bool x)

স্ট্রাক্টস

টেনসরফ্লো :: অপ্স :: কম্বাইন্ডননম্যাক্সপ্রপ্রেশন :: অ্যাটার্স

কম্বাইন্ডননম্যাক্সসপ্রেশনের জন্য ptionচ্ছিক অ্যাট্রিবিউট সেটটার।

জনসাধারণের গুণাবলী

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_class

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

অপারেশন

Operation operation

বৈধ_শক্তি

028 বি 3 এফি 0

পাবলিক ফাংশন

সম্মিলিতনম্যাক্সপ্রেসেশন

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

সম্মিলিতনম্যাক্সপ্রেসেশন

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

ক্লিপবক্সস

Attrs ClipBoxes(
  bool x
)

প্যাডক্লাস

Attrs PadPerClass(
  bool x
)