imagenet_v2

ImageNet-v2 ist ein ImageNet-Testset (10 pro Klasse), das unter strikter Einhaltung des ursprünglichen Kennzeichnungsprotokolls gesammelt wurde. Jedes Bild wurde von mindestens 10 MTurk-Mitarbeitern beschriftet, möglicherweise mehr, und abhängig von der Strategie, die verwendet wurde, um auszuwählen, welche Bilder unter die 10 für die jeweilige Klasse ausgewählten Bilder aufgenommen werden sollen, gibt es drei verschiedene Versionen des Datensatzes. Weitere Informationen zur Zusammenstellung der verschiedenen Varianten finden Sie in Abschnitt vier des Papiers.

Der Etikettenraum ist der gleiche wie bei ImageNet2012. Jedes Beispiel wird als Wörterbuch mit den folgenden Schlüsseln dargestellt:

  • 'image': Das Bild, ein (H, W, 3)-Tensor.
  • 'label': Eine ganze Zahl im Bereich [0, 1000).
  • 'file_name': Ein eindeutiger Sting, der das Beispiel innerhalb des Datasets identifiziert.

  • Homepage: https://github.com/modestyachts/ImageNetV2

  • Quellcode: tfds.image_classification.ImagenetV2

  • Versionen:

    • 1.0.0 : Erste Version.
    • 2.0.0 : Dateien aktualisiert.
    • 3.0.0 (Standard): Fix file_name, von absolutem Pfad zu Pfad relativ zum Datenverzeichnis, das heißt: "class_id / filename.jpg".
  • Auto-cached ( Dokumentation ): Nein

  • Splits:

Teilt Beispiele
'test' 10.000
  • Eigenschaften:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/matched-frequency (Standardkonfiguration)

Visualisierung

imagenet_v2/threshold-0.7

Visualisierung

imagenet_v2/topimages

Visualisierung