cifar10_1

Der CIFAR-10.1-Datensatz ist ein neuer Testsatz für CIFAR-10. CIFAR-10.1 enthält etwa 2.000 neue Testbilder, die nach mehrjähriger Forschung am ursprünglichen CIFAR-10-Datensatz aufgenommen wurden. Die Datensammlung für CIFAR-10.1 wurde entwickelt, um die Verteilungsverschiebung relativ zum ursprünglichen Datensatz zu minimieren. Die Entstehung von CIFAR-10.1 beschreiben wir in der Arbeit "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". Die Bilder in CIFAR-10.1 sind eine Teilmenge des TinyImages-Datensatzes. Derzeit gibt es zwei Versionen des CIFAR-10.1-Datensatzes: v4 und v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (Standardkonfiguration)

  • Config Beschreibung: Es ist die erste Version unseres Datensatzes , auf dem wir alle Klassifizierer getestet. Wie oben erwähnt, macht dies den v4-Datensatz unabhängig von den von uns ausgewerteten Klassifikatoren. Die Zahlen in den Hauptabschnitten unseres Artikels verwenden diese Version des Datensatzes. Es wurde aus den 25 wichtigsten TinyImages-Schlüsselwörtern für jede Klasse erstellt, was zu einem leichten Klassenungleichgewicht führte. Der größte Unterschied besteht darin, dass Schiffe statt 10 % nur 8 % des Testsets ausmachen. v4 enthält 2.021 Bilder.

  • Downloadgröße: 5.93 MiB

  • Dataset Größe: 4.46 MiB

  • Splits:

Teilt Beispiele
'test' 2.021

Visualisierung

cifar10_1/v6

  • Config Beschreibung: Es ist abgeleitet von einer leicht verbesserten Schlüsselwort Zuordnung , die genau Klasse ist ausgeglichen. Diese Version des Datensatzes entspricht den Ergebnissen in Anhang D unserer Arbeit. v6 enthält 2.000 Bilder.

  • Downloadgröße: 5.87 MiB

  • Dataset Größe: 4.40 MiB

  • Splits:

Teilt Beispiele
'test' 2.000

Visualisierung