تينسورفلو :: العمليات :: NonMaxSuppressionV5.0 قمع غير ماكس

#include <image_ops.h>

يختار جشعًا مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة.

ملخص

تتداخل الصناديق التي تحتوي على نسبة عالية من التقاطع مع الاتحاد (IOU) مع المربعات المحددة مسبقًا. تتم إزالة score_threshold تحتوي على نقاط أقل من score_threshold . يتم توفير المربعات المحيطة كـ [y1 ، x1 ، y2 ، x2] ، حيث (y1 ، x1) و (y2 ، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن توفير الإحداثيات على أنها طبيعية (على سبيل المثال ، تقع في الفاصل الزمني [0 ، 1]) أو مطلق. لاحظ أن هذه الخوارزمية غير محددة للمكان الذي يوجد فيه الأصل في نظام الإحداثيات وبشكل أكثر عمومية فهي ثابتة للتحولات المتعامدة وترجمات نظام الإحداثيات ؛ وبالتالي فإن ترجمة نظام الإحداثيات أو انعكاساته ينتج عنه اختيار المربعات نفسها بواسطة الخوارزمية. ناتج هذه العملية عبارة عن مجموعة من الأعداد الصحيحة التي يتم فهرستها في مجموعة الإدخال من المربعات المحيطة التي تمثل المربعات المحددة. يمكن بعد ذلك الحصول على إحداثيات المربع المحيط المقابلة للمؤشرات المحددة باستخدام عملية tf.gather operation . على سبيل المثال: selected_indices = tf.image.non_max_suppression_v2 (المربعات ، الدرجات ، max_output_size ، iou_threshold ، Score_threshold) selected_boxes = tf.gather (المربعات ، المؤشرات المحددة) يدعم هذا المرجع أيضًا وضع Soft-NMS (مع الترجيح الغوسي) ، https://arxiv.org/abs/1704.04503 ) حيث تقلل المربعات درجة المربعات المتداخلة الأخرى بدلاً من التسبب في تشذيبها مباشرةً. لتمكين وضع Soft-NMS هذا ، soft_nms_sigma معلمة soft_nms_sigma على أن تكون أكبر من 0.

الحجج:

  • النطاق: كائن النطاق
  • مربعات: موتر عائم ثنائي الأبعاد للشكل [num_boxes, 4] .
  • الدرجات: موتر عائم 1-D للشكل [num_boxes] يمثل درجة واحدة مناظرة لكل مربع (كل صف من المربعات).
  • max_output_size: موتر عدد صحيح عددي يمثل الحد الأقصى لعدد المربعات التي سيتم اختيارها عن طريق عدم الحد الأقصى للقمع.
  • iou_threshold: موتر عائم 0-D يمثل الحد الأدنى لتقرير ما إذا كانت الصناديق تتداخل كثيرًا فيما يتعلق بـ IOU.
  • Score_threshold: موتر عائم 0-D يمثل الحد الأدنى لتقرير وقت إزالة المربعات بناءً على الدرجة.
  • soft_nms_sigma: موتر عائم 0-D يمثل معلمة سيجما لـ Soft NMS ؛ انظر بودلا وآخرون (راجع https://arxiv.org/abs/1704.04503 ). عندما يكون soft_nms_sigma=0.0 (وهو افتراضي) ، فإننا نعود إلى NMS القياسي (الثابت).

السمات الاختيارية (انظر Attrs ):

  • pad_to_max_output_size: إذا كان هذا صحيحًا ، فإن الناتج selected_indices هو مبطن ليكون بطول max_output_size . افتراضات على خطأ.

عائدات:

  • Output selected_indices: موتر عدد صحيح 1-D للشكل [M] يمثل المؤشرات المحددة من موتر المربعات ، حيث M <= max_output_size .
  • Output selected_scores: موتر عائم 1-D للشكل [M] يمثل الدرجات المقابلة لكل مربع محدد ، حيث M <= max_output_size . تختلف الدرجات فقط عن درجات الإدخال المقابلة عند استخدام Soft NMS (أي عندما soft_nms_sigma>0 )
  • Output valid_outputs: موتر عدد صحيح 0-D يمثل عدد العناصر الصالحة في المؤشرات selected_indices ، مع ظهور العناصر الصالحة أولاً.

البنائين والمدمرين

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

السمات العامة

operation
selected_indices
selected_scores
valid_outputs

وظائف ثابتة عامة

PadToMaxOutputSize (bool x)

الهياكل

tensorflow :: ops :: NonMaxSuppressionV5 :: Attrs

محددات السمات الاختيارية لـ NonMaxSuppressionV5 .

السمات العامة

عملية

Operation operation

مؤشرات_مختارة

::tensorflow::Output selected_indices

درجات_مختارة

::tensorflow::Output selected_scores

نواتج صالحة

::tensorflow::Output valid_outputs

الوظائف العامة

NonMaxSuppressionV5.0 قمع غير مكثف

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

غير ماكس

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

وظائف ثابتة عامة

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)