tensorflow:: אופס:: CombinedNonMaxSuppression

#include <image_ops.h>

בוחר בתאוותנות קבוצת משנה של תיבות תוחמות בסדר יורד של הניקוד,.

פעולה זו מבצעת non_max_suppression בכניסות לכל אצווה, בכל המחלקות. גוזם תיבות בעלות איחוד גבוה של צומת-על-איגוד (IOU) חופפות לקופסאות שנבחרו בעבר. תיבות תוחמות מסופקות בתור [y1, x1, y2, x2], כאשר (y1, x1) ו-(y2, x2) הן הקואורדינטות של כל זוג אלכסוני של פינות תיבה וניתן לספק את הקואורדינטות כמנורמלות (כלומר, שוכבות בתוך המרווח [0, 1]) או מוחלט. שימו לב שאלגוריתם זה הוא אגנוסטי למקום שבו נמצא המקור במערכת הקואורדינטות. שים לב גם שאלגוריתם זה אינו משתנה לטרנספורמציות אורתוגונליות ותרגומים של מערכת הקואורדינטות; לפיכך, תרגום או השתקפויות של מערכת הקואורדינטות מביאים לכך שאותן תיבות נבחרות על ידי האלגוריתם. הפלט של פעולה זו הוא התיבות הסופיות, הציונים והטנזור המחלקות שהוחזרו לאחר ביצוע non_max_suppression.

טיעונים:

  • scope: אובייקט Scope
  • תיבות: טנזור צף 4-D בעל צורה [batch_size, num_boxes, q, 4] . אם q הוא 1 אזי משתמשים באותן תיבות עבור כל המחלקות, אחרת, אם q שווה למספר המחלקות, נעשה שימוש בתיבות ספציפיות לכיתה.
  • ציונים: טנזור צף תלת-ממדי של צורה [batch_size, num_boxes, num_classes] המייצג ניקוד בודד המתאים לכל תיבה (כל שורה של תיבות).
  • max_output_size_per_class: טנזור שלם סקלארי המייצג את המספר המרבי של תיבות שייבחרו על ידי דיכוי לא מקסימלי לכל מחלקה
  • max_total_size: סקלאר המייצג את המספר המרבי של תיבות שנשמרו בכל המחלקות.
  • iou_threshold: טנזור צף 0-D המייצג את הסף להחלטה אם תיבות חופפות יותר מדי ביחס ל-IOU.
  • score_threshold: טנזור צף 0-D המייצג את הסף להחלטה מתי להסיר תיבות על סמך הניקוד.

מאפיינים אופציונליים (ראה Attrs ):

  • pad_per_class: אם false, תיבות ה-nmsed הפלט, הציונים והמחלקות מרופדות/חתומות ל- max_total_size . אם זה נכון, תיבות, ציונים ומחלקות nmsed פלט מרופדים להיות באורך max_size_per_class * num_classes , אלא אם כן הוא חורג מ- max_total_size ובמקרה זה נחתך ל- max_total_size . ברירת המחדל ל-false.
  • clip_boxes: אם נכון, נניח שהקואורדינטות של התיבה הן בין [0, 1] וקטע את תיבות הפלט אם הן נופלות מעבר ל-[0, 1]. אם לא נכון, אל תבצע גזירה ותוציא את קואורדינטות התיבה כפי שהיא.

החזרות:

  • Output nmsed_boxes: טנסור [batch_size, max_detections, 4] float32 המכיל את התיבות הלא מדוכאות.
  • Output nmsed_scores: טנסור [batch_size, max_detections] float32 המכיל את הציונים עבור התיבות.
  • Output nmsed_classes: טנסור [batch_size, max_detections] float32 המכיל את המחלקות עבור התיבות.
  • Output valid_detections: טנסור [batch_size] int32 המציין את מספר הזיהויים החוקיים לכל פריט אצווה. רק ערכי num_detections[i] העליונים ב-nms_boxes[i], nms_scores[i] ו-nms_class[i] תקפים. שאר הערכים הם אפס ריפודים.

בנאים והורסים

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

פונקציות סטטיות ציבוריות

ClipBoxes (bool x)
PadPerClass (bool x)

מבנים

tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs

קובעי תכונות אופציונליים עבור CombinedNonMaxSuppression .

תכונות ציבוריות

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

מִבצָע

Operation operation

חוקי_זיהויים

::tensorflow::Output valid_detections

תפקידים ציבוריים

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

פונקציות סטטיות ציבוריות

קופסאות קליפ

Attrs ClipBoxes(
  bool x
)

PadPerClass

Attrs PadPerClass(
  bool x
)