CombinedNonMaxSuppression

public final class CombinedNonMaxSuppression

Seleziona avidamente un sottoinsieme di riquadri di selezione in ordine decrescente di punteggio,

Questa operazione esegue non_max_suppression sugli input per batch, in tutte le classi. Elimina le scatole che hanno un'elevata sovrapposizione di intersezione su unione (IOU) con le scatole selezionate in precedenza. I riquadri di delimitazione sono forniti come [y1, x1, y2, x2], dove (y1, x1) e (y2, x2) sono le coordinate di qualsiasi coppia diagonale di angoli del riquadro e le coordinate possono essere fornite come normalizzate (cioè, giacenti in l'intervallo [0, 1]) o assoluto. Notare che questo algoritmo è agnostico rispetto al punto in cui l'origine è nel sistema di coordinate. Si noti inoltre che questo algoritmo è invariante alle trasformazioni ortogonali e alle traslazioni del sistema di coordinate; quindi la traduzione o le riflessioni del sistema di coordinate risultano nelle stesse caselle selezionate dall'algoritmo. L'output di questa operazione sono le caselle finali, i punteggi e il tensore delle classi restituiti dopo aver eseguito non_max_suppression.

Classi annidate

classe CombinedNonMaxSuppression.Options Attributi facoltativi per CombinedNonMaxSuppression

Metodi pubblici

static CombinedNonMaxSuppression.Options
clipBoxes (booleani clipBoxes)
static CombinedNonMaxSuppression
creare ( Ambito di applicazione portata, operando <> Float scatole, operando <> Float colonne sonore, operando <Integer> maxOutputSizePerClass, Operando <Integer> maxTotalSize, operando <Float> iouThreshold, operando <Float> scoreThreshold, Opzioni ... Opzioni)
Metodo Factory per creare una classe che esegue il wrapping di una nuova operazione CombinedNonMaxSuppression.
Uscita <Float>
nmsedBoxes ()
Un tensore [batch_size, max_detections, 4] float32 contenente le caselle non-max soppresse.
Uscita <Float>
nmsedClasses ()
Un tensore float32 [batch_size, max_detections] contenente le classi per i box.
Uscita <Float>
nmsedScores ()
Un tensore float32 [batch_size, max_detections] contenente i punteggi per le caselle.
static CombinedNonMaxSuppression.Options
padPerClass (booleano padPerClass)
Uscita <Integer>
validDetections ()
Un tensore [batch_size] int32 che indica il numero di rilevamenti validi per elemento batch.

Metodi ereditati

Metodi pubblici

public static CombinedNonMaxSuppression.Options clipBoxes (Boolean clipBoxes)

Parametri
clipBoxes Se vero, supponi che le coordinate del riquadro siano comprese tra [0, 1] e ritaglia le caselle di output se cadono oltre [0, 1]. Se false, non ritagliare e visualizzare le coordinate della casella così com'è.

public static CombinedNonMaxSuppression creare ( Ambito di applicazione, Operando <> Float scatole, operando <> Float colonne sonore, operando <Integer> maxOutputSizePerClass, Operando <Integer> maxTotalSize, operando <Float> iouThreshold, operando <Float> scoreThreshold, Opzioni ... Opzioni)

Metodo Factory per creare una classe che esegue il wrapping di una nuova operazione CombinedNonMaxSuppression.

Parametri
scopo ambito attuale
scatole Un tensore a virgola mobile 4-D di forma `[batch_size, num_boxes, q, 4]`. Se "q" è 1, vengono utilizzate le stesse caselle per tutte le classi altrimenti, se "q" è uguale al numero di classi, vengono utilizzate caselle specifiche della classe.
punteggi Un tensore a virgola mobile 3-D di forma "[batch_size, num_boxes, num_classes]" che rappresenta un singolo punteggio corrispondente a ciascuna casella (ciascuna riga di caselle).
maxOutputSizePerClass Un tensore intero scalare che rappresenta il numero massimo di caselle da selezionare mediante soppressione non massima per classe
maxTotalSize Uno scalare che rappresenta il numero massimo di caselle mantenute in tutte le classi.
iouThreshold Un tensore a virgola mobile 0-D che rappresenta la soglia per decidere se le caselle si sovrappongono troppo rispetto a IOU.
scoreThreshold Un tensore a virgola mobile 0-D che rappresenta la soglia per decidere quando rimuovere le caselle in base al punteggio.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di CombinedNonMaxSuppression

output pubblico <Float> nmsedBoxes ()

Un tensore [batch_size, max_detections, 4] float32 contenente le caselle non-max soppresse.

output pubblico <Float> nmsedClasses ()

Un tensore float32 [batch_size, max_detections] contenente le classi per i box.

output pubblico <Float> nmsedScores ()

Un tensore float32 [batch_size, max_detections] contenente i punteggi per le caselle.

public static CombinedNonMaxSuppression.Options padPerClass (Boolean padPerClass)

Parametri
padPerClass Se false, le caselle, i punteggi e le classi di output vengono riempiti / ritagliati a "max_total_size". Se vero, le caselle di output nmsed, i punteggi e le classi vengono riempiti per essere di lunghezza `max_size_per_class` *` num_classes`, a meno che non superi `max_total_size`, nel qual caso viene ritagliato a` max_total_size`. Il valore predefinito è false.

output pubblico <Integer> validDetections ()

Un tensore [batch_size] int32 che indica il numero di rilevamenti validi per elemento batch. Sono valide solo le prime num_detections [i] voci in nms_boxes [i], nms_scores [i] e nms_class [i]. Il resto delle voci sono zero padding.