tensorflow:: אופס:: NonMaxSuppressionV5

#include <image_ops.h>

בוחר בתאוותנות קבוצת משנה של תיבות תוחמות בסדר יורד של הניקוד,.

סיכום

גיזום תיבות בעלות חפיפה גבוהה של צומת-על-איחוד (IOU) עם תיבות שנבחרו בעבר. תיבות תוחמות עם ציון נמוך מ- score_threshold מוסרות. תיבות תוחמות מסופקות בתור [y1, x1, y2, x2], כאשר (y1, x1) ו-(y2, x2) הן הקואורדינטות של כל זוג אלכסוני של פינות תיבה וניתן לספק את הקואורדינטות כמנורמלות (כלומר, שוכבות בתוך המרווח [0, 1]) או מוחלט. שימו לב שאלגוריתם זה הוא אגנוסטי למקום שבו המקור נמצא במערכת הקואורדינטות, ובאופן כללי יותר אינו משתנה לתמורות אורתוגונליות ותרגומים של מערכת הקואורדינטות; לפיכך, תרגום או השתקפויות של מערכת הקואורדינטות מביאים לכך שאותן תיבות נבחרות על ידי האלגוריתם. הפלט של פעולה זו הוא קבוצה של מספרים שלמים המופיעים באינדקס לאוסף הקלט של תיבות תוחמות המייצגות את התיבות שנבחרו. לאחר מכן ניתן לקבל את קואורדינטות התיבה התוחמת המתאימות למדדים שנבחרו באמצעות tf.gather operation . לדוגמה: selected_indices = tf.image.non_max_suppression_v2( boxes, scores, max_output_size, iou_threshold, score_threshold) selected_boxes = tf.gather(boxes, selected_indexes) אופציה זו תומכת גם במצב Soft-NMS (עם שקלול גאוסי וכו') (cf , https://arxiv.org/abs/1704.04503 ) שבו תיבות מפחיתות את הניקוד של תיבות חופפות אחרות במקום לגרום ישירות לחיתוך שלהן. כדי להפעיל מצב Soft-NMS זה, הגדר את הפרמטר soft_nms_sigma להיות גדול מ-0.

טיעונים:

  • scope: אובייקט Scope
  • תיבות: טנזור צף דו-ממדי בעל צורה [num_boxes, 4] .
  • ציונים: טנזור צף 1-D של צורה [num_boxes] המייצג ניקוד בודד המתאים לכל תיבה (כל שורה של תיבות).
  • max_output_size: טנזור שלם סקלארי המייצג את המספר המרבי של תיבות שייבחרו על ידי דיכוי לא מקסימלי.
  • iou_threshold: טנזור צף 0-D המייצג את הסף להחלטה אם תיבות חופפות יותר מדי ביחס ל-IOU.
  • score_threshold: טנזור צף 0-D המייצג את הסף להחלטה מתי להסיר תיבות על סמך הניקוד.
  • soft_nms_sigma: טנזור צף 0-D המייצג את פרמטר הסיגמה עבור Soft NMS; ראה Bodla et al (cf https://arxiv.org/abs/1704.04503 ). כאשר soft_nms_sigma=0.0 (שהוא ברירת המחדל), אנו חוזרים ל-NMS סטנדרטי (קשה).

מאפיינים אופציונליים (ראה Attrs ):

  • pad_to_max_output_size: אם נכון, הפלט selected_indices מרופד באורך max_output_size . ברירת המחדל ל-false.

החזרות:

  • Output select_indices: טנסור שלם 1-D של צורה [M] המייצג את המדדים שנבחרו מהטנסור של התיבות, כאשר M <= max_output_size .
  • Output תוצאות נבחרות: טנזור צף 1-D בצורת [M] המייצג את הציונים המתאימים לכל תיבה שנבחרה, כאשר M <= max_output_size . הציונים שונים רק מציוני הקלט המקבילים בעת שימוש ב-Soft NMS (כלומר כאשר soft_nms_sigma>0 )
  • Output valid_outputs: טנזור 0-D שלם המייצג את מספר האלמנטים החוקיים ב- selected_indices , כאשר האלמנטים החוקיים מופיעים ראשונים.

בנאים והורסים

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

תכונות ציבוריות

operation
selected_indices
selected_scores
valid_outputs

פונקציות סטטיות ציבוריות

PadToMaxOutputSize (bool x)

מבנים

tensorflow:: ops:: NonMaxSuppressionV5:: Attrs

קובעי תכונות אופציונליים עבור NonMaxSuppressionV5 .

תכונות ציבוריות

מבצע

Operation operation

נבחרים_מדדים

::tensorflow::Output selected_indices

תוצאות_נבחרת

::tensorflow::Output selected_scores

valid_outputs

::tensorflow::Output valid_outputs

תפקידים ציבוריים

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

פונקציות סטטיות ציבוריות

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)