dòng chảy :: hoạt động :: NonMaxSuppressionV5

#include <image_ops.h>

Tham lam chọn một tập hợp con các hộp giới hạn theo thứ tự điểm số giảm dần,.

Tóm lược

loại bỏ các hộp có nhiều điểm chồng chéo lên nhau (IOU) với các hộp đã chọn trước đó. Các hộp giới hạn có điểm nhỏ hơn score_threshold sẽ bị xóa. Các hộp giới hạn được cung cấp dưới dạng [y1, x1, y2, x2], trong đó (y1, x1) và (y2, x2) là tọa độ của bất kỳ cặp góc chéo nào của góc hộp và tọa độ có thể được cung cấp dưới dạng chuẩn hóa (tức là nằm trong khoảng [0, 1]) hoặc tuyệt đối. Lưu ý rằng thuật toán này là bất khả tri đối với vị trí gốc nằm trong hệ tọa độ và nói chung là bất biến đối với các phép biến đổi và phép tịnh tiến trực giao của hệ tọa độ; do đó dịch chuyển hoặc phản xạ của hệ tọa độ dẫn đến các hộp giống nhau được chọn bởi thuật toán. Đầu ra của thao tác này là một tập hợp các số nguyên được lập chỉ mục vào bộ sưu tập đầu vào của các hộp giới hạn đại diện cho các hộp đã chọn. Sau đó có thể lấy tọa độ hộp giới hạn tương ứng với các chỉ số đã chọn bằng cách sử dụng tf.gather operation . Ví dụ: select_indices = tf.image.non_max_suppression_v2 (hộp, điểm, max_output_size, iou_threshold, score_threshold) select_boxes = tf.gather (box, select_indices) Lựa chọn này cũng hỗ trợ chế độ Soft-NMS (với trọng số Gaussian) (xem Bodla et al , https://arxiv.org/abs/1704.04503 ) trong đó các hộp làm giảm điểm của các hộp chồng chéo khác thay vì trực tiếp khiến chúng bị cắt bớt. Để bật chế độ Soft-NMS này, hãy đặt tham số soft_nms_sigma lớn hơn 0.

Tranh luận:

  • phạm vi: Một đối tượng Phạm vi
  • hộp: Một tenxơ nổi 2-D có hình dạng [num_boxes, 4] .
  • điểm số: Một tensor float 1-D của hình dạng [num_boxes] biểu thị một điểm duy nhất tương ứng với mỗi hộp (mỗi hàng hộp).
  • max_output_size: Một tensor số nguyên vô hướng đại diện cho số lượng hộp tối đa được chọn bằng cách triệt tiêu không tối đa.
  • iou_threshold: Một bộ căng phao 0-D đại diện cho ngưỡng để quyết định xem các hộp có chồng chéo quá nhiều so với IOU hay không.
  • score_threshold: Một dấu thăng 0-D biểu thị ngưỡng để quyết định thời điểm loại bỏ các hộp dựa trên điểm số.
  • soft_nms_sigma: Một tensor float 0-D đại diện cho tham số sigma cho Soft NMS; xem Bodla và cộng sự (xem https://arxiv.org/abs/1704.04503 ). Khi soft_nms_sigma=0.0 (là mặc định), chúng tôi quay trở lại NMS tiêu chuẩn (cứng).

Các thuộc tính tùy chọn (xem Phần Attrs ):

  • pad_to_max_output_size: Nếu đúng, sản lượng selected_indices được đệm để có độ dài max_output_size . Giá trị mặc định là false.

Lợi nhuận:

  • Output được Output số: Một tensor số nguyên 1-D của hình dạng [M] đại diện cho các chỉ số được chọn từ tensor hộp, trong đó M <= max_output_size .
  • Output : Một tensor float 1-D của hình [M] biểu thị các điểm tương ứng cho mỗi hộp đã chọn, trong đó M <= max_output_size . Điểm chỉ khác với điểm đầu vào tương ứng khi sử dụng Soft NMS (tức là khi soft_nms_sigma>0 )
  • Output valid_outputs: Một tensor số nguyên 0-D đại diện cho số phần tử hợp lệ trong selected_indices , với các phần tử hợp lệ xuất hiện đầu tiên.

Người xây dựng và Người phá hủy

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

Thuộc tính công khai

operation
selected_indices
selected_scores
valid_outputs

Các chức năng tĩnh công khai

PadToMaxOutputSize (bool x)

Cấu trúc

tensorflow :: ops :: NonMaxSuppressionV5 :: Attrs

Bộ thiết lập thuộc tính tùy chọn cho NonMaxSuppressionV5 .

Thuộc tính công khai

hoạt động

Operation operation

lựa_chọn

::tensorflow::Output selected_indices

đã chọn_scores

::tensorflow::Output selected_scores

valid_outputs

::tensorflow::Output valid_outputs

Chức năng công cộng

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

Các chức năng tĩnh công khai

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)