open_images_challenge2019_detection

Open Images to wspólne wydanie około 9 milionów obrazów z adnotacjami z etykietami na poziomie obrazu, ramkami ograniczającymi obiekty, maskami segmentacji obiektów i relacjami wizualnymi. Ten wyjątkowo duży i zróżnicowany zestaw danych ma na celu stymulowanie najnowocześniejszych postępów w analizie i zrozumieniu obrazów.

Zawiera dane ze ścieżki wykrywania obiektów konkurencji. Celem tej ścieżki jest przewidzenie ciasnej ramki ograniczającej wokół wszystkich instancji obiektów z 500 klas.

Obrazy są opatrzone pozytywnymi etykietami na poziomie obrazu, wskazującymi na obecność pewnych klas obiektów, oraz negatywnymi etykietami na poziomie obrazu, wskazującymi na brak niektórych klas. W konkursie wszystkie inne klasy bez adnotacji są wykluczone z oceny na tym obrazie. Dla każdej pozytywnej etykiety na poziomie obrazu na obrazie opatrzono adnotacją każde wystąpienie tej klasy obiektów na obrazie.

Rozdzielać Przykłady
'test' 99 999
'train' 1 743 042
'validation' 41620
  • Struktura funkcji :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
bobjects Sekwencja
bobjects/bbox Funkcja BBox (4,) pływak32
bobjects/is_group_of Napinacz bool
bobjects/etykieta Etykieta klasy int64
ID Tekst strunowy
obraz Obraz (Brak, Brak, 3) uint8
obiekty Sekwencja
przedmioty/pewność siebie Napinacz pływak32
obiekty/etykieta Etykieta klasy int64
obiekty/źródło Tekst strunowy

open_images_challenge2019_detection/200k (domyślna konfiguracja)

  • Opis konfiguracji : Obrazy mają maksymalnie 200 000 pikseli w jakości 72 JPEG.

  • Rozmiar zestawu danych : 59.06 GiB

  • Rysunek ( tfds.show_examples ):

Wyobrażanie sobie

open_images_challenge2019_detection/300 tys

  • Opis konfiguracji : Obrazy mają maksymalnie 300 000 pikseli w jakości 72 JPEG.

  • Rozmiar zestawu danych : 80.10 GiB

  • Rysunek ( tfds.show_examples ):

Wyobrażanie sobie