- Opis :
Open Images to wspólne wydanie około 9 milionów obrazów opatrzonych etykietami na poziomie obrazu, ramkami ograniczającymi obiekty, maskami segmentacji obiektów i relacjami wizualnymi. Ten wyjątkowo duży i zróżnicowany zbiór danych ma na celu pobudzenie najnowocześniejszego postępu w analizowaniu i rozumieniu obrazów.
Zawiera dane ze ścieżki wykrywania obiektów zawodów. Celem tej ścieżki jest przewidzenie wąskiej ramki ograniczającej wokół wszystkich instancji obiektów z 500 klas.
Obrazy są oznaczone pozytywnymi etykietami na poziomie obrazu, wskazującymi obecność pewnych klas obiektów, oraz negatywnymi etykietami na poziomie obrazu, wskazującymi na nieobecność pewnych klas. W konkursie wszystkie inne klasy bez adnotacji są wyłączone z oceny na tym obrazie. Dla każdej pozytywnej etykiety na poziomie obrazu opatrzono adnotacją każde wystąpienie tej klasy obiektów na obrazie.
Strona główna : https://storage.googleapis.com/openimages/web/challenge2019.html
Kod źródłowy :
tfds.datasets.open_images_challenge2019_detection.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wydaniu.
-
Rozmiar pobierania :
534.63 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 99 999 |
'train' | 1 743 042 |
'validation' | 41620 |
- Struktura funkcji :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
Bobjects | Sekwencja | |||
bobjects/bbox | Funkcja BBox | (4,) | pływak32 | |
bobjects/is_group_of | Napinacz | bool | ||
Bobjects/etykieta | Etykieta klasy | int64 | ||
ID | Tekst | strunowy | ||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
obiekty | Sekwencja | |||
obiekty/pewność siebie | Napinacz | pływak32 | ||
obiekty/etykieta | Etykieta klasy | int64 | ||
obiekty/źródło | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Cytat :
open_images_challenge2019_detection/200k (konfiguracja domyślna)
Opis konfiguracji : Obrazy mają maksymalnie 200 000 pikseli i jakość JPEG 72.
Rozmiar zbioru danych :
59.06 GiB
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
Opis konfiguracji : Obrazy mają maksymalnie 300 000 pikseli i jakość JPEG 72.
Rozmiar zbioru danych :
80.10 GiB
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):