cifar10_1

Kumpulan data CIFAR-10.1 adalah kumpulan pengujian baru untuk CIFAR-10. CIFAR-10.1 berisi sekitar 2.000 gambar uji baru yang diambil sampelnya setelah beberapa tahun penelitian pada dataset CIFAR-10 asli. Pengumpulan data untuk CIFAR-10.1 dirancang untuk meminimalkan pergeseran distribusi relatif terhadap dataset asli. Kami menjelaskan pembuatan CIFAR-10.1 dalam makalah "Apakah Pengklasifikasi CIFAR-10 Digeneralisasikan ke CIFAR-10?". Gambar dalam CIFAR-10.1 adalah subset dari dataset TinyImages. Saat ini ada dua versi kumpulan data CIFAR-10.1: v4 dan v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
FiturDict
gambar Gambar (32, 32, 3) tf.uint8
label Label Kelas tf.int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (konfigurasi default)

  • Deskripsi konfigurasi : Ini adalah versi pertama dari kumpulan data kami tempat kami menguji pengklasifikasi apa pun. Seperti disebutkan di atas, ini membuat kumpulan data v4 tidak bergantung pada pengklasifikasi yang kami evaluasi. Angka-angka yang dilaporkan di bagian utama makalah kami menggunakan versi kumpulan data ini. Itu dibangun dari 25 kata kunci TinyImages teratas untuk setiap kelas, yang menyebabkan sedikit ketidakseimbangan kelas. Perbedaan terbesar adalah bahwa kapal hanya menghasilkan 8% dari set uji, bukan 10%. v4 berisi 2.021 gambar.

  • Ukuran unduhan : 5.93 MiB

  • Ukuran kumpulan data : 4.46 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.021

cifar10_1/v6

  • Deskripsi konfigurasi : Ini berasal dari alokasi kata kunci yang sedikit ditingkatkan yang benar-benar seimbang kelas. Versi dataset ini sesuai dengan hasil dalam Lampiran D makalah kami. v6 berisi 2.000 gambar.

  • Ukuran unduhan : 5.87 MiB

  • Ukuran kumpulan data : 4.40 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.000