imagenet2012_real

  • Description :

Cet ensemble de données contient des images de validation ILSVRC-2012 (ImageNet) augmentées d'un nouvel ensemble d'étiquettes « Re-Assessed » (ReaL) de l'article « Are we done with ImageNet », voir https://arxiv.org/abs/2006.07159 . les étiquettes sont collectées à l’aide du protocole amélioré, ce qui donne lieu à des annotations multi-étiquettes et plus précises.

Remarque importante : environ 3 500 exemples ne contiennent aucune étiquette, ceux-ci doivent être exclus de la moyenne lors du calcul de la précision . Une façon possible de procéder consiste à utiliser le code NumPy suivant :

is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
  • Page d'accueil : https://github.com/google-research/reassessed-imagenet

  • Code source : tfds.datasets.imagenet2012_real.Builder

  • Versions :

    • 1.0.0 (par défaut) : version initiale
  • Taille du téléchargement : 379.37 KiB

  • Taille de l'ensemble de données : 6.25 GiB

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez les données sources manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ) :
    manual_dir doit contenir le fichier ILSVRC2012_img_val.tar . Vous devez vous inscrire sur http://www.image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.

  • Mise en cache automatique ( documentation ) : Non

  • Divisions :

Diviser Exemples
'validation' 50 000
  • Structure des fonctionnalités :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
nom de fichier Texte chaîne
image Image (Aucun, Aucun, 3) uint8
étiquette_originale Étiquette de classe int64
étiquette_réelle Séquence (ClassLabel) (Aucun,) int64

Visualisation

  • Citation :
@article{beyer2020imagenet,
  title={Are we done with ImageNet?},
  author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title={ {ImageNet Large Scale Visual Recognition Challenge} },
  Year={2015},
  journal={International Journal of Computer Vision (IJCV)},
  doi={10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}