تينسورفلو :: العمليات :: مجتمعة غير قمع

#include <image_ops.h>

يختار جشعًا مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة.

ملخص

تنفذ هذه العملية non_max_suppression على المدخلات لكل دفعة ، عبر جميع الفئات. مربعات الخوخ التي تحتوي على نسبة عالية من التقاطع فوق الاتحاد (IOU) تتداخل مع المربعات المحددة مسبقًا. يتم توفير المربعات المحيطة كـ [y1 ، x1 ، y2 ، x2] ، حيث (y1 ، x1) و (y2 ، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن توفير الإحداثيات على أنها طبيعية (على سبيل المثال ، تقع في الفاصل الزمني [0 ، 1]) أو مطلق. لاحظ أن هذه الخوارزمية لا تعرف مكان الأصل في نظام الإحداثيات. لاحظ أيضًا أن هذه الخوارزمية ثابتة للتحويلات المتعامدة وترجمات نظام الإحداثيات ؛ وبالتالي فإن ترجمة نظام الإحداثيات أو انعكاساته ينتج عنه اختيار المربعات نفسها بواسطة الخوارزمية. ناتج هذه العملية هو المربعات النهائية والنتائج وفئات موتر التي تم إرجاعها بعد تنفيذ non_max_suppression.

الحجج:

  • النطاق: كائن النطاق
  • مربعات: موتر عائم [batch_size, num_boxes, q, 4] الأبعاد من الشكل [batch_size, num_boxes, q, 4] . إذا كانت q هي 1 ، فسيتم استخدام نفس المربعات لجميع الفئات وإلا ، إذا كانت q تساوي عدد الفئات ، فسيتم استخدام المربعات الخاصة بالفئة.
  • الدرجات: موتر عائم ثلاثي الأبعاد للشكل [batch_size, num_boxes, num_classes] يمثل درجة واحدة تتوافق مع كل مربع (كل صف من المربعات).
  • max_output_size_per_class: موتر عدد صحيح عددي يمثل الحد الأقصى لعدد المربعات التي سيتم تحديدها عن طريق عدم الحد الأقصى للقمع لكل فئة
  • max_total_size: مقياس يمثل الحد الأقصى لعدد المربعات المحتفظ بها في جميع الفئات.
  • iou_threshold: موتر عائم 0-D يمثل العتبة لتقرير ما إذا كانت الصناديق تتداخل كثيرًا فيما يتعلق بـ IOU.
  • Score_threshold: موتر عائم 0-D يمثل الحد الأدنى لتقرير وقت إزالة المربعات بناءً على الدرجة.

السمات الاختيارية (انظر Attrs ):

  • pad_per_class: إذا كانت خاطئة ، فإن مربعات nmsed الناتجة والنتائج والفئات تكون مبطنة / مقطوعة إلى max_total_size . إذا كان هذا صحيحًا ، فستكون مربعات الإخراج nmsed والنتائج والفئات مبطنة لتكون بطول max_size_per_class * num_classes ، ما لم يتجاوز max_total_size وفي هذه الحالة يتم قصه إلى max_total_size . افتراضات على خطأ.
  • clip_boxes: إذا كان هذا صحيحًا ، افترض أن إحداثيات الصندوق تقع بين [0 ، 1] وقم بقص مربعات الإخراج إذا كانت تتجاوز [0 ، 1]. إذا كانت خاطئة ، فلا تقم بقص وإخراج إحداثيات الصندوق كما هي.

عائدات:

  • Output nmsed_boxes: A [batch_size، max_detections، 4] موتر float32 يحتوي على الصناديق غير المقيدة بحد أقصى.
  • Output nmsed_scores: موتر [حجم_الجمعة ، max_detections] يحتوي على درجات للمربعات.
  • Output nmsed_classes: A [batch_size، max_detections] موتر float32 يحتوي على فئات الصناديق.
  • Output valid_detections: A [batch_size] int32 موتر تشير إلى عدد المكتشفة صالحة لكل بند دفعة واحدة. فقط أعلى عدد من عمليات الكشف [i] إدخالات في nms_boxes [i] و nms_scores [i] و nms_class [i] صالحة. باقي الإدخالات عبارة عن حشوات صفرية.

البنائين والمدمرين

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

السمات العامة

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

وظائف ثابتة عامة

ClipBoxes (bool x)
PadPerClass (bool x)

الهياكل

tensorflow :: العمليات :: CombinedNonMaxSuppression :: Attrs

محددات السمات الاختيارية لـ CombinedNonMaxSuppression .

السمات العامة

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

عملية

Operation operation

إكتشافات صالحة

::tensorflow::Output valid_detections

الوظائف العامة

مجتمعة غير قمع

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

مجتمعة غير قمع

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

وظائف ثابتة عامة

ClipBoxes

Attrs ClipBoxes(
  bool x
)

PadPerClass

Attrs PadPerClass(
  bool x
)