- Descriptif :
L'ensemble de données Stanford Dogs contient des images de 120 races de chiens du monde entier. Cet ensemble de données a été construit à l'aide d'images et d'annotations d'ImageNet pour la tâche de catégorisation fine des images. Il existe 20 580 images, dont 12 000 sont utilisées pour la formation et 8 580 pour les tests. Des étiquettes de classe et des annotations de boîte englobante sont fournies pour les 12 000 images.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : http://vision.stanford.edu/aditya86/ImageNetDogs/main.html
Code source :
tfds.datasets.stanford_dogs.Builder
Versions :
-
0.2.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
778.12 MiB
Taille du jeu de données :
744.72 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 8 580 |
'train' | 12 000 |
- Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/nom de fichier | Texte | chaîne | ||
étiquette | Étiquette de classe | int64 | ||
objets | Séquence | |||
objets/bbox | BBoxFeature | (4,) | float32 |
Clés supervisées (Voir
as_supervised
doc ):('image', 'label')
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
Li, K. and Fei-Fei, L.},
TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
BOOKTITLE = {CVPR09},
YEAR = {2009},
BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}