جریان تنسور:: عملیات:: CombinedNonMaxSuppression

#include <image_ops.h>

حریصانه زیرمجموعه ای از جعبه های محدود کننده را به ترتیب امتیاز نزولی انتخاب می کند.

خلاصه

این عملیات non_max_suppression را روی ورودی‌های هر دسته، در همه کلاس‌ها انجام می‌دهد. جعبه‌هایی را که دارای تقاطع بیش از حد (IOU) بالا هستند با جعبه‌های انتخاب شده قبلی همپوشانی دارند. جعبه های مرزی به صورت [y1، x1، y2، x2] عرضه می شوند، که در آن (y1، x1) و (y2، x2) مختصات هر جفت مورب گوشه های جعبه هستند و مختصات را می توان به صورت نرمال ارائه کرد (یعنی خوابیده در فاصله [0، 1]) یا مطلق. توجه داشته باشید که این الگوریتم نسبت به جایی که مبدأ در سیستم مختصات است آگنوستیک است. همچنین توجه داشته باشید که این الگوریتم نسبت به تبدیل‌های متعامد و ترجمه‌های سیستم مختصات ثابت است. بنابراین ترجمه یا بازتاب سیستم مختصات منجر به انتخاب کادرهای مشابه توسط الگوریتم می شود. خروجی این عملیات، کادرهای نهایی، امتیازها و تانسور کلاس‌هایی است که پس از انجام non_max_suppression برگردانده می‌شوند.

استدلال ها:

  • scope: یک شی Scope
  • جعبه ها: یک تانسور شناور 4 بعدی با شکل [batch_size, num_boxes, q, 4] . اگر q 1 باشد، جعبه‌های یکسان برای همه کلاس‌ها استفاده می‌شود، در غیر این صورت، اگر q برابر با تعداد کلاس‌ها باشد، از کادرهای مخصوص کلاس استفاده می‌شود.
  • امتیازها: یک تانسور شناور سه بعدی با شکل [batch_size, num_boxes, num_classes] که نشان دهنده یک امتیاز منفرد مربوط به هر جعبه (هر ردیف از جعبه ها) است.
  • max_output_size_per_class: یک تانسور عدد صحیح اسکالر که نشان دهنده حداکثر تعداد کادرهایی است که باید با سرکوب غیر حداکثر در هر کلاس انتخاب شوند.
  • max_total_size: یک اسکالر نشان دهنده حداکثر تعداد جعبه های حفظ شده در تمام کلاس ها.
  • iou_threshold: یک تانسور شناور 0-D که آستانه ای را برای تصمیم گیری در مورد همپوشانی بیش از حد جعبه ها نسبت به IOU نشان می دهد.
  • score_threshold: یک تانسور شناور 0-D که آستانه تصمیم گیری برای حذف جعبه ها بر اساس امتیاز را نشان می دهد.

ویژگی های اختیاری (به Attrs مراجعه کنید):

  • pad_per_class: اگر نادرست باشد، جعبه‌های nmsed خروجی، امتیازها و کلاس‌ها به max_total_size اضافه می‌شوند/بریده می‌شوند. اگر درست باشد، جعبه‌های nmsed خروجی، امتیازها و کلاس‌ها به طول max_size_per_class * num_classes اضافه می‌شوند، مگر اینکه از max_total_size بیشتر شود که در این صورت به max_total_size بریده می‌شود. پیش فرض به نادرست.
  • clip_boxes: اگر درست است، فرض کنید مختصات کادر بین [0، 1] باشد و اگر از [0، 1] خارج شد، جعبه‌های خروجی را قطع کنید. اگر نادرست است، برش را انجام ندهید و مختصات جعبه را همانطور که هست خارج کنید.

برمی‌گرداند:

  • Output nmsed_boxes: یک [batch_size, max_detections, 4] float32 تانسور حاوی جعبه های غیرحداکثر سرکوب شده.
  • Output nmsed_scores: تانسور [batch_size, max_detections] float32 حاوی امتیازات جعبه ها.
  • Output nmsed_classes: یک [batch_size, max_detections] تانسور float32 حاوی کلاس‌های جعبه‌ها.
  • Output valid_detections: یک تانسور [batch_size] int32 که تعداد شناسایی‌های معتبر در هر آیتم دسته‌ای را نشان می‌دهد. فقط ورودی‌های num_detections[i] برتر در nms_boxes[i]، nms_scores[i] و nms_class[i] معتبر هستند. بقیه ورودی‌ها بدون بالشتک هستند.

سازندگان و ویرانگرها

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

صفات عمومی

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

توابع استاتیک عمومی

ClipBoxes (bool x)
PadPerClass (bool x)

سازه ها

tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs

تنظیم کننده های ویژگی اختیاری برای CombinedNonMaxSuppression .

صفات عمومی

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

عمل

Operation operation

valid_detections

::tensorflow::Output valid_detections

توابع عمومی

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

توابع استاتیک عمومی

Clipboxes

Attrs ClipBoxes(
  bool x
)

PadPerClass

Attrs PadPerClass(
  bool x
)