CombinedNonMaxSuppression

publiczna klasa końcowa CombinedNonMaxSuppression

Chciwie wybiera podzbiór obwiedni w malejącej kolejności punktów,

Ta operacja wykonuje non_max_suppression na wejściach na partię, we wszystkich klasach. Usuwa pola, które mają wysoki współczynnik przecięcia nad sumą (IOU) i nakładają się na wcześniej wybrane pola. Ramki ograniczające są dostarczane jako [y1, x1, y2, x2], gdzie (y1, x1) i (y2, x2) są współrzędnymi dowolnej pary przekątnych narożników prostokątów, a współrzędne mogą być podane jako znormalizowane (tzn. leżące w przedział [0, 1]) lub bezwzględny. Należy zauważyć, że ten algorytm jest niezależny od tego, gdzie początek znajduje się w układzie współrzędnych. Należy również zauważyć, że algorytm ten jest niezmienniczy w stosunku do transformacji ortogonalnych i translacji układu współrzędnych; w ten sposób tłumaczenie lub odbicia układu współrzędnych powodują, że algorytm wybiera te same pola. Wynikiem tej operacji są końcowe pudełka, wyniki i tensor klas zwrócone po wykonaniu non_max_suppression.

Klasy zagnieżdżone

klasa Opcje łączoneNonMaxSuppression Opcjonalne atrybuty dla CombinedNonMaxSuppression

Metody publiczne

statyczne CombinedNonMaxSuppression.Options
ClipBoxes (Boolean ClipBoxes)
statyczne Połączone tłumienie niemaks
utwórz (zakres zakresu , pola argumentu <Float>, wyniki argumentu <Float>, argumentu <Integer> maxOutputSizePerClass, argumentu <liczby całkowitej> maxTotalSize, argumentu <Float> iouThreshold, argumentu <Float> scoreThreshold, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CombinedNonMaxSuppression.
Wyjście <Pływak>
nmsedBoxes ()
Tensor [batch_size, max_detections, 4] float32 zawierający pola inne niż maksymalne.
Wyjście <Pływak>
nmsedClasses ()
Tensor float32 [batch_size, max_detections] zawierający klasy dla pudełek.
Wyjście <Pływak>
nmsedScores ()
Tensor float32 [batch_size, max_detections] zawierający wyniki dla pól.
statyczne CombinedNonMaxSuppression.Options
padPerClass (Boolean padPerClass)
Wyjście <liczba całkowita>
prawidłowe wykrycia ()
Tensor [batch_size] int32 wskazujący liczbę prawidłowych wykryć na element partii.

Metody dziedziczone

Metody publiczne

public static CombinedNonMaxSuppression.Options ClipBoxes (Boolean ClipBoxes)

Parametry
ClipBoxy Jeśli to prawda, załóż, że współrzędne pola mieszczą się w przedziale [0, 1] i przytnij pola wyjściowe, jeśli wykraczają poza [0, 1]. Jeśli fałszywe, nie wykonuj przycinania i wypisz współrzędne pudełka w niezmienionej postaci.

public static CombinedNonMaxSuppression create (zakres zakresu , pola argumentu <Float>, wyniki argumentu <Float>, argument <Integer> maxOutputSizePerClass, argument <Integer> maxTotalSize, argument <Float> iouThreshold, argument <Float> scoreThreshold , opcje ... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CombinedNonMaxSuppression.

Parametry
zakres aktualny zakres
pudła 4-D tensor zmiennoprzecinkowy o kształcie „[batch_size, num_boxes, q, 4]”. Jeśli `q` wynosi 1, wówczas dla wszystkich klas używane są te same pola, w przeciwnym razie, jeśli `q` jest równe liczbie klas, używane są pola specyficzne dla danej klasy.
wyniki Trójwymiarowy tensor zmiennoprzecinkowy o kształcie „[batch_size, num_boxes, num_classes]” reprezentujący pojedynczy wynik odpowiadający każdemu polu (każdemu rzędowi pól).
maxOutputSizePerClass Skalarny tensor będący liczbą całkowitą reprezentujący maksymalną liczbę pól, które mają zostać wybrane przez tłumienie inne niż maksymalne na klasę
maxTotalRozmiar Skalar int32 reprezentujący maksymalną liczbę pól zachowanych we wszystkich klasach. Należy pamiętać, że ustawienie tej wartości na dużą liczbę może spowodować błąd OOM, w zależności od obciążenia systemu.
iuPróg Tensor zmiennoprzecinkowy 0-D reprezentujący próg decydujący o tym, czy pola nakładają się zbytnio na IOU.
Próg wyniku Tensor zmiennoprzecinkowy 0-D reprezentujący próg decydujący o tym, kiedy usunąć pola na podstawie wyniku.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja CombinedNonMaxSuppression

publiczne wyjście <Float> nmsedBoxes ()

Tensor [batch_size, max_detections, 4] float32 zawierający pola inne niż maksymalne.

publiczne wyjście <Float> nmsedClasses ()

Tensor float32 [batch_size, max_detections] zawierający klasy dla pudełek.

publiczne wyjście <Float> nmsedScores ()

Tensor float32 [batch_size, max_detections] zawierający wyniki dla pól.

public static CombinedNonMaxSuppression.Options padPerClass (Boolean padPerClass)

Parametry
padNaKlasę Jeśli fałsz, wyjściowe pola, wyniki i klasy są dopełniane/przycinane do `max_total_size`. Jeśli ma wartość true, wyjściowe pola, wyniki i klasy są dopełniane tak, aby miały długość `max_size_per_class`*`num_classes`, chyba że przekracza ona `max_total_size`, w którym to przypadku jest przycinana do `max_total_size`. Domyślnie jest to fałsz.

publiczne wyjście <liczba całkowita> validDetections ()

Tensor [batch_size] int32 wskazujący liczbę prawidłowych wykryć na element partii. Poprawne są tylko najwyższe wpisy num_detections[i] w nms_boxes[i], nms_scores[i] i nms_class[i]. Reszta wpisów to zerowe uzupełnienia.