cifar10_1

  • Keterangan :

Kumpulan data CIFAR-10.1 adalah kumpulan pengujian baru untuk CIFAR-10. CIFAR-10.1 berisi sekitar 2.000 gambar uji baru yang diambil sampelnya setelah beberapa tahun melakukan penelitian pada kumpulan data CIFAR-10 asli. Pengumpulan data untuk CIFAR-10.1 dirancang untuk meminimalkan pergeseran distribusi dibandingkan dengan kumpulan data asli. Kami menjelaskan pembuatan CIFAR-10.1 dalam makalah "Apakah Pengklasifikasi CIFAR-10 Generalisasi ke CIFAR-10?". Gambar di CIFAR-10.1 adalah bagian dari kumpulan data TinyImages. Saat ini terdapat dua versi kumpulan data CIFAR-10.1: v4 dan v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
gambar Gambar (32, 32, 3) uint8
label Label Kelas int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (konfigurasi default)

  • Deskripsi konfigurasi : Ini adalah versi pertama dari kumpulan data tempat kami menguji pengklasifikasi apa pun. Seperti disebutkan di atas, hal ini membuat kumpulan data v4 tidak bergantung pada pengklasifikasi yang kami evaluasi. Angka-angka yang dilaporkan di bagian utama makalah kami menggunakan versi kumpulan data ini. Itu dibangun dari 25 kata kunci TinyImages teratas untuk setiap kelas, yang menyebabkan sedikit ketidakseimbangan kelas. Perbedaan terbesarnya adalah kapal hanya mengambil 8% dari set pengujian, bukan 10%. v4 berisi 2.021 gambar.

  • Ukuran unduhan : 5.93 MiB

  • Ukuran kumpulan data : 4.46 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.021

Visualisasi

cifar10_1/v6

  • Deskripsi konfigurasi : Ini berasal dari alokasi kata kunci yang sedikit ditingkatkan sehingga kelasnya seimbang. Versi kumpulan data ini sesuai dengan hasil pada Lampiran D makalah kami. v6 berisi 2.000 gambar.

  • Ukuran unduhan : 5.87 MiB

  • Ukuran kumpulan data : 4.40 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.000

Visualisasi