imagenet_v2

  • Description :

ImageNet-v2 est un ensemble de tests ImageNet (10 par classe) collecté en suivant de près le protocole d'étiquetage d'origine. Chaque image a été étiquetée par au moins 10 travailleurs de MTurk, voire plus, et selon la stratégie utilisée pour sélectionner les images à inclure parmi les 10 choisies pour la classe donnée, il existe trois versions différentes de l'ensemble de données. Veuillez vous référer à la section quatre du document pour plus de détails sur la façon dont les différentes variantes ont été compilées.

L'espace des étiquettes est le même que celui d'ImageNet2012. Chaque exemple est représenté sous forme de dictionnaire avec les clés suivantes :

  • 'image' : L'image, un (H, W, 3)-tenseur.
  • « étiquette » : un entier compris dans la plage [0, 1 000).
  • 'file_name' : une chaîne unique identifiant l'exemple dans l'ensemble de données.

  • Page d'accueil : https://github.com/modestyachts/ImageNetV2

  • Code source : tfds.datasets.imagenet_v2.Builder

  • Versions :

    • 1.0.0 : Version initiale.
    • 2.0.0 : Fichiers mis à jour.
    • 3.0.0 (par défaut) : Correction du nom de fichier, du chemin absolu au chemin relatif au répertoire de données, c'est-à-dire : "class_id/filename.jpg".
    • 3.1.0 : Nouvelles URL pour les ressources de Hugging Face.
  • Mise en cache automatique ( documentation ) : Non

  • Divisions :

Diviser Exemples
'test' 10 000
  • Structure des fonctionnalités :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
nom de fichier Texte chaîne
image Image (Aucun, Aucun, 3) uint8
étiquette Étiquette de classe int64
@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/matched-fréquence (configuration par défaut)

  • Taille du téléchargement : 1.18 GiB

  • Taille du jeu de données : 1.16 GiB

  • Figure ( tfds.show_examples ) :

Visualisation

imagenet_v2/seuil-0.7

  • Taille du téléchargement : 1.16 GiB

  • Taille du jeu de données : 1.15 GiB

  • Figure ( tfds.show_examples ) :

Visualisation

imagenet_v2/topimages

  • Taille du téléchargement : 1.16 GiB

  • Taille de l'ensemble de données : 1.14 GiB

  • Figure ( tfds.show_examples ) :

Visualisation