Questa operazione produce Region of Interests da dati bounding box (bbox_deltas) codificati rispetto agli ancoraggi secondo l'equazione 2 in arXiv: 1506.01497
L'operazione seleziona le caselle di punteggio `pre_nms_topn` superiori, le decodifica rispetto agli ancoraggi, applica la soppressione non massima sulle caselle sovrapposte con valore di intersezione su unione (iou) maggiore di` nms_threshold`, scartando le caselle in cui il lato più corto è minore di ` min_size`. Input: `score`: un tensore di forma 4D [Batch, Altezza, Larghezza, Num ancore] contenente i punteggi per ancoraggio in una data posizione` bbox_deltas`: è un tensore di forma [Batch, Altezza, Larghezza, 4 x Num ancore] caselle codificate per ogni ancoraggio "ancore": Un tensore 1D di forma [4 x Num Anchors], che rappresenta gli ancoraggi. Output: `rois`: output RoI, un tensore 3D di forma [Batch, post_nms_topn, 4], riempito da 0 se sono stati trovati meno di post_nms_topn candidati. `roi_probabilities`: punteggi di probabilità di ogni roi in 'rois', un tensore di forma 2D [Batch, post_nms_topn], riempito con 0 se necessario, ordinato per punteggi.
Classi annidate
classe | GenerateBoundingBoxProposals.Options | Attributi facoltativi per GenerateBoundingBoxProposals |
Metodi pubblici
static GenerateBoundingBoxProposals | create ( Scope scope, Operando <Float> punteggi, Operando <Float> bboxDeltas, Operando <Float> imageInfo, Operando <Float> ancore, Operando <Float> nmsThreshold, Operando <Integer> preNmsTopn, Operando <Float> minSize, Opzioni .. . opzioni) Metodo Factory per creare una classe che racchiude una nuova operazione GenerateBoundingBoxProposals. |
static GenerateBoundingBoxProposals.Options | postNmsTopn ( postNmsTopn lungo) |
Uscita <Float> | roiProbabilities () Un tensore a virgola mobile 2-D di forma `[num_images, post_nms_topn]` che rappresenta il punteggio della casella della regione di interesse nel tensore `rois` allo stesso indice. |
Uscita <Float> | rois () Un tensore a virgola mobile 3-D di forma "[num_images, post_nms_topn, 4]" che rappresenta la regione di interesse selezionata. |
Metodi ereditati
Metodi pubblici
public static GenerateBoundingBoxProposals creano ( Ambito di applicazione, operando <Float> colonne sonore, operando <Float> bboxDeltas, operando <Float> ImageInfo, operando <Float> ancore, operando <Float> nmsThreshold, Operando <Integer> preNmsTopn, operando <Float> minSize, Opzioni ... opzioni)
Metodo Factory per creare una classe che racchiude una nuova operazione GenerateBoundingBoxProposals.
Parametri
scopo | ambito attuale |
---|---|
punteggi | Un tensore a virgola mobile 4-D di forma "[num_images, height, width, num_achors]" contenente i punteggi delle caselle per date ancore, può non essere ordinato. |
bboxDeltas | Un tensore a virgola mobile 4-D di forma `[num_images, height, width, 4 x num_anchors]`. caselle di codifica con rispetto ad ogni ancoraggio. Le coordinate sono fornite nella forma [dy, dx, dh, dw]. |
imageInfo | Un tensore a virgola mobile 2-D di forma "[num_images, 5]" contenente informazioni sull'immagine Altezza, Larghezza, Scala. |
ancore | Un tensore a virgola mobile 2-D di forma `[num_anchors, 4]` che descrive le caselle di ancoraggio. Le caselle sono formattate nella forma [y1, x1, y2, x2]. |
nmsThreshold | Un tensore a virgola mobile scalare per la soglia di soppressione non massima. |
preNmsTopn | Un int tensore scalare per il numero di caselle con il punteggio più alto da utilizzare come input. |
minSize | Un tensore flottante scalare. Qualsiasi scatola di dimensioni inferiori a min_size verrà scartata. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di GenerateBoundingBoxProposals
public static GenerateBoundingBoxProposals.Options postNmsTopn (Long postNmsTopn)
Parametri
postNmsTopn | Un numero intero. Numero massimo di rois in uscita. |
---|
output pubblico <Float> roiProbabilities ()
Un tensore a virgola mobile 2-D di forma `[num_images, post_nms_topn]` che rappresenta il punteggio della casella della regione di interesse nel tensore `rois` allo stesso indice.
output pubblico <Float> rois ()
Un tensore a virgola mobile 3-D di forma "[num_images, post_nms_topn, 4]" che rappresenta la regione di interesse selezionata. Ordinati in ordine decrescente in punteggi.