Visualisation : Explorer dans Know Your Data
Descriptif :
Cet ensemble de données contient des images de validation ILSVRC-2012 (ImageNet) complétées par un nouvel ensemble d'étiquettes "Re-Assessed" (ReaL) de l'article "Are we done with ImageNet", voir https://arxiv.org/abs/2006.07159 Ces les étiquettes sont collectées à l'aide du protocole amélioré, ce qui se traduit par des annotations multi-étiquettes et plus précises.
Remarque importante : environ 3500 exemples ne contiennent pas d'étiquette, ceux-ci doivent être exclus de la moyenne lors du calcul de la précision . Une façon possible de le faire est d'utiliser le code NumPy suivant :
is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
Page d'accueil : https://github.com/google-research/reassessed-imagenet
Code source :
tfds.datasets.imagenet2012_real.Builder
Versions :
-
1.0.0
(par défaut) : version initiale
-
Taille du téléchargement :
379.37 KiB
Taille du jeu de données :
6.25 GiB
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans
download_config.manual_dir
(par défaut,~/tensorflow_datasets/downloads/manual/
) :
manual_dir doit contenir le fichierILSVRC2012_img_val.tar
. Vous devez vous inscrire sur http://www.image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'validation' | 50 000 |
- Structure des fonctionnalités :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
nom de fichier | Texte | chaîne de caractères | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
étiquette_d'origine | Étiquette de classe | int64 | ||
real_label | Séquence(ClassLabel) | (Aucun,) | int64 |
Clés supervisées (Voir
as_supervised
doc ):('image', 'real_label')
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
- Citation :
@article{beyer2020imagenet,
title={Are we done with ImageNet?},
author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title={ {ImageNet Large Scale Visual Recognition Challenge} },
Year={2015},
journal={International Journal of Computer Vision (IJCV)},
doi={10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}