- opis :
Zbiór danych Stanford Dogs zawiera obrazy 120 ras psów z całego świata. Ten zestaw danych został zbudowany przy użyciu obrazów i adnotacji z ImageNet w celu szczegółowej kategoryzacji obrazów. Dostępnych jest 20 580 obrazów, z których 12 000 służy do trenowania, a 8580 do testowania. Etykiety klas i adnotacje dotyczące ramek są dostępne dla wszystkich 12 000 obrazów.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : http://vision.stanford.edu/aditya86/ImageNetDogs/main.html
Kod źródłowy :
tfds.datasets.stanford_dogs.Builder
Wersje :
-
0.2.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
778.12 MiB
Rozmiar zbioru danych :
744.72 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 8580 |
'train' | 12 000 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
obraz/nazwa pliku | Tekst | strunowy | ||
etykieta | Etykieta klasy | int64 | ||
obiekty | Sekwencja | |||
obiekty/bbox | Funkcja BBox | (4,) | pływak32 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
Li, K. and Fei-Fei, L.},
TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
BOOKTITLE = {CVPR09},
YEAR = {2009},
BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}