tensorflow:: אופס:: NonMaxSuppressionV5
#include <image_ops.h>
בוחר בתאוותנות קבוצת משנה של תיבות תוחמות בסדר יורד של הניקוד,.
תַקצִיר
גיזום תיבות בעלות חפיפה גבוהה של צומת-על-איחוד (IOU) עם תיבות שנבחרו בעבר. תיבות תוחמות עם ציון נמוך מ- score_threshold
מוסרות. תיבות תוחמות מסופקות בתור [y1, x1, y2, x2], כאשר (y1, x1) ו-(y2, x2) הן הקואורדינטות של כל זוג אלכסוני של פינות תיבה וניתן לספק את הקואורדינטות כמנורמלות (כלומר, שוכבות בתוך המרווח [0, 1]) או מוחלט. שימו לב שאלגוריתם זה הוא אגנוסטי למקום שבו המקור נמצא במערכת הקואורדינטות, ובאופן כללי יותר אינו משתנה לתמורות אורתוגונליות ותרגומים של מערכת הקואורדינטות; לפיכך, תרגום או השתקפויות של מערכת הקואורדינטות מביאים לכך שאותן תיבות נבחרות על ידי האלגוריתם. הפלט של פעולה זו הוא קבוצה של מספרים שלמים המופיעים באינדקס לאוסף הקלט של תיבות תוחמות המייצגות את התיבות שנבחרו. לאחר מכן ניתן לקבל את קואורדינטות התיבה התוחמת המתאימות למדדים שנבחרו באמצעות tf.gather operation
. לדוגמה: selected_indices = tf.image.non_max_suppression_v2( boxes, scores, max_output_size, iou_threshold, score_threshold) selected_boxes = tf.gather(boxes, selected_indexes) אופציה זו תומכת גם במצב Soft-NMS (עם שקלול גאוסי וכו') (cf , https://arxiv.org/abs/1704.04503 ) שבהם תיבות מפחיתות את הניקוד של תיבות חופפות אחרות במקום לגרום ישירות לחיתוך שלהן. כדי להפעיל מצב Soft-NMS זה, הגדר את הפרמטר soft_nms_sigma
להיות גדול מ-0.
טיעונים:
- scope: אובייקט Scope
- תיבות: טנזור צף דו-ממדי בעל צורה
[num_boxes, 4]
. - ציונים: טנזור צף 1-D של צורה
[num_boxes]
המייצג ניקוד בודד המתאים לכל תיבה (כל שורה של תיבות). - max_output_size: טנזור שלם סקלארי המייצג את המספר המרבי של תיבות שייבחרו על ידי דיכוי לא מקסימלי.
- iou_threshold: טנזור צף 0-D המייצג את הסף להחלטה אם תיבות חופפות יותר מדי ביחס ל-IOU.
- score_threshold: טנזור צף 0-D המייצג את הסף להחלטה מתי להסיר תיבות על סמך הניקוד.
- soft_nms_sigma: טנזור צף 0-D המייצג את פרמטר הסיגמה עבור Soft NMS; ראה Bodla et al (cf https://arxiv.org/abs/1704.04503 ). כאשר
soft_nms_sigma=0.0
(שהוא ברירת המחדל), אנו חוזרים ל-NMS סטנדרטי (קשה).
מאפיינים אופציונליים (ראה Attrs
):
- pad_to_max_output_size: אם נכון, הפלט
selected_indices
מרופד באורךmax_output_size
. ברירת המחדל ל-false.
החזרות:
-
Output
select_indices: טנסור שלם 1-D של צורה[M]
המייצג את המדדים שנבחרו מהטנסור של התיבות, כאשרM <= max_output_size
. -
Output
נבחרות: טנזור צף 1-D בצורת[M]
המייצג את הציונים המתאימים לכל תיבה שנבחרה, כאשרM <= max_output_size
. הציונים שונים רק מציוני הקלט המקבילים בעת שימוש ב-Soft NMS (כלומר כאשרsoft_nms_sigma>0
) -
Output
valid_outputs: טנזור 0-D שלם המייצג את מספר האלמנטים החוקיים ב-selected_indices
, כאשר האלמנטים החוקיים מופיעים ראשונים.
בנאים והורסים | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
תכונות ציבוריות | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
פונקציות סטטיות ציבוריות | |
---|---|
PadToMaxOutputSize (bool x) |
מבנים | |
---|---|
tensorflow:: ops:: NonMaxSuppressionV5:: Attrs | קובעי תכונות אופציונליים עבור NonMaxSuppressionV5 . |
תכונות ציבוריות
מִבצָע
Operation operation
נבחרים_מדדים
::tensorflow::Output selected_indices
תוצאות_נבחרת
::tensorflow::Output selected_scores
valid_outputs
::tensorflow::Output valid_outputs
תפקידים ציבוריים
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
פונקציות סטטיות ציבוריות
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )
אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers. Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.
עדכון אחרון: 2024-11-25 (שעון UTC).