cifar10_1

Kumpulan data CIFAR-10.1 adalah kumpulan pengujian baru untuk CIFAR-10. CIFAR-10.1 berisi sekitar 2.000 gambar uji baru yang diambil sampelnya setelah beberapa tahun penelitian pada dataset CIFAR-10 asli. Pengumpulan data untuk CIFAR-10.1 dirancang untuk meminimalkan pergeseran distribusi relatif terhadap kumpulan data asli. Kami menjelaskan pembuatan CIFAR-10.1 dalam makalah "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". Gambar di CIFAR-10.1 adalah bagian dari kumpulan data TinyImages. Saat ini ada dua versi dataset CIFAR-10.1: v4 dan v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
gambar Gambar (32, 32, 3) uint8
label LabelKelas int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (konfigurasi default)

  • Deskripsi konfigurasi : Ini adalah versi pertama dari kumpulan data kami tempat kami menguji pengklasifikasi apa pun. Seperti disebutkan di atas, ini membuat dataset v4 tidak bergantung pada pengklasifikasi yang kami evaluasi. Angka-angka yang dilaporkan di bagian utama makalah kami menggunakan versi kumpulan data ini. Itu dibangun dari 25 kata kunci TinyImages teratas untuk setiap kelas, yang menyebabkan sedikit ketidakseimbangan kelas. Perbedaan terbesar adalah bahwa kapal hanya menghasilkan 8% dari set pengujian, bukan 10%. v4 berisi 2.021 gambar.

  • Ukuran unduhan : 5.93 MiB

  • Ukuran dataset : 4.46 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.021

Visualisasi

cifar10_1/v6

  • Deskripsi konfigurasi : Ini berasal dari alokasi kata kunci yang sedikit lebih baik yang benar-benar seimbang kelasnya. Versi dataset ini sesuai dengan hasil dalam Lampiran D makalah kami. v6 berisi 2.000 gambar.

  • Ukuran unduhan : 5.87 MiB

  • Ukuran dataset : 4.40 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.000

Visualisasi