Seleziona avidamente un sottoinsieme di riquadri di selezione in ordine decrescente di punteggio,
Questa operazione esegue non_max_suppression sugli input per batch, in tutte le classi. Elimina le scatole che hanno un'elevata sovrapposizione di intersezione su unione (IOU) con le scatole selezionate in precedenza. I riquadri di delimitazione sono forniti come [y1, x1, y2, x2], dove (y1, x1) e (y2, x2) sono le coordinate di qualsiasi coppia diagonale di angoli del riquadro e le coordinate possono essere fornite come normalizzate (cioè, giacenti in l'intervallo [0, 1]) o assoluto. Notare che questo algoritmo è agnostico rispetto al punto in cui l'origine è nel sistema di coordinate. Si noti inoltre che questo algoritmo è invariante alle trasformazioni ortogonali e alle traslazioni del sistema di coordinate; quindi la traduzione o le riflessioni del sistema di coordinate risultano nelle stesse caselle selezionate dall'algoritmo. L'output di questa operazione sono le caselle finali, i punteggi e il tensore delle classi restituiti dopo aver eseguito non_max_suppression.
Classi annidate
classe | CombinedNonMaxSuppression.Options | Attributi facoltativi per CombinedNonMaxSuppression |
Metodi pubblici
static CombinedNonMaxSuppression.Options | clipBoxes (booleani clipBoxes) |
static CombinedNonMaxSuppression | creare ( Ambito di applicazione portata, operando <> Float scatole, operando <> Float colonne sonore, operando <Integer> maxOutputSizePerClass, Operando <Integer> maxTotalSize, operando <Float> iouThreshold, operando <Float> scoreThreshold, Opzioni ... Opzioni) Metodo Factory per creare una classe che esegue il wrapping di una nuova operazione CombinedNonMaxSuppression. |
Uscita <Float> | nmsedBoxes () Un tensore [batch_size, max_detections, 4] float32 contenente le caselle non-max soppresse. |
Uscita <Float> | nmsedClasses () Un tensore float32 [batch_size, max_detections] contenente le classi per i box. |
Uscita <Float> | nmsedScores () Un tensore float32 [batch_size, max_detections] contenente i punteggi per le caselle. |
static CombinedNonMaxSuppression.Options | padPerClass (booleano padPerClass) |
Uscita <Integer> | validDetections () Un tensore [batch_size] int32 che indica il numero di rilevamenti validi per elemento batch. |
Metodi ereditati
Metodi pubblici
public static CombinedNonMaxSuppression.Options clipBoxes (Boolean clipBoxes)
Parametri
clipBoxes | Se vero, supponi che le coordinate del riquadro siano comprese tra [0, 1] e ritaglia le caselle di output se cadono oltre [0, 1]. Se false, non ritagliare e visualizzare le coordinate della casella così com'è. |
---|
public static CombinedNonMaxSuppression creare ( Ambito di applicazione, Operando <> Float scatole, operando <> Float colonne sonore, operando <Integer> maxOutputSizePerClass, Operando <Integer> maxTotalSize, operando <Float> iouThreshold, operando <Float> scoreThreshold, Opzioni ... Opzioni)
Metodo Factory per creare una classe che esegue il wrapping di una nuova operazione CombinedNonMaxSuppression.
Parametri
scopo | ambito attuale |
---|---|
scatole | Un tensore a virgola mobile 4-D di forma `[batch_size, num_boxes, q, 4]`. Se "q" è 1, vengono utilizzate le stesse caselle per tutte le classi altrimenti, se "q" è uguale al numero di classi, vengono utilizzate caselle specifiche della classe. |
punteggi | Un tensore a virgola mobile 3-D di forma "[batch_size, num_boxes, num_classes]" che rappresenta un singolo punteggio corrispondente a ciascuna casella (ciascuna riga di caselle). |
maxOutputSizePerClass | Un tensore intero scalare che rappresenta il numero massimo di caselle da selezionare mediante soppressione non massima per classe |
maxTotalSize | Uno scalare che rappresenta il numero massimo di caselle mantenute in tutte le classi. |
iouThreshold | Un tensore a virgola mobile 0-D che rappresenta la soglia per decidere se le caselle si sovrappongono troppo rispetto a IOU. |
scoreThreshold | Un tensore a virgola mobile 0-D che rappresenta la soglia per decidere quando rimuovere le caselle in base al punteggio. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di CombinedNonMaxSuppression
output pubblico <Float> nmsedBoxes ()
Un tensore [batch_size, max_detections, 4] float32 contenente le caselle non-max soppresse.
output pubblico <Float> nmsedClasses ()
Un tensore float32 [batch_size, max_detections] contenente le classi per i box.
output pubblico <Float> nmsedScores ()
Un tensore float32 [batch_size, max_detections] contenente i punteggi per le caselle.
public static CombinedNonMaxSuppression.Options padPerClass (Boolean padPerClass)
Parametri
padPerClass | Se false, le caselle, i punteggi e le classi di output vengono riempiti / ritagliati a "max_total_size". Se vero, le caselle di output nmsed, i punteggi e le classi vengono riempiti per essere di lunghezza `max_size_per_class` *` num_classes`, a meno che non superi `max_total_size`, nel qual caso viene ritagliato a` max_total_size`. Il valore predefinito è false. |
---|
output pubblico <Integer> validDetections ()
Un tensore [batch_size] int32 che indica il numero di rilevamenti validi per elemento batch. Sono valide solo le prime num_detections [i] voci in nms_boxes [i], nms_scores [i] e nms_class [i]. Il resto delle voci sono zero padding.