- Keterangan :
Kumpulan data CIFAR-10.1 adalah kumpulan pengujian baru untuk CIFAR-10. CIFAR-10.1 berisi sekitar 2.000 gambar uji baru yang diambil sampelnya setelah beberapa tahun melakukan penelitian pada kumpulan data CIFAR-10 asli. Pengumpulan data untuk CIFAR-10.1 dirancang untuk meminimalkan pergeseran distribusi dibandingkan dengan kumpulan data asli. Kami menjelaskan pembuatan CIFAR-10.1 dalam makalah "Apakah Pengklasifikasi CIFAR-10 Generalisasi ke CIFAR-10?". Gambar di CIFAR-10.1 adalah bagian dari kumpulan data TinyImages. Saat ini terdapat dua versi kumpulan data CIFAR-10.1: v4 dan v6.
Kode sumber :
tfds.image_classification.Cifar10_1
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
gambar | Gambar | (32, 32, 3) | uint8 | |
label | Label Kelas | int64 |
Kunci yang diawasi (Lihat dokumen
as_supervised
):('image', 'label')
Kutipan :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (konfigurasi default)
Deskripsi konfigurasi : Ini adalah versi pertama dari kumpulan data tempat kami menguji pengklasifikasi apa pun. Seperti disebutkan di atas, hal ini membuat kumpulan data v4 tidak bergantung pada pengklasifikasi yang kami evaluasi. Angka-angka yang dilaporkan di bagian utama makalah kami menggunakan versi kumpulan data ini. Itu dibangun dari 25 kata kunci TinyImages teratas untuk setiap kelas, yang menyebabkan sedikit ketidakseimbangan kelas. Perbedaan terbesarnya adalah kapal hanya mengambil 8% dari set pengujian, bukan 10%. v4 berisi 2.021 gambar.
Ukuran unduhan :
5.93 MiB
Ukuran kumpulan data :
4.46 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.021 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
cifar10_1/v6
Deskripsi konfigurasi : Ini berasal dari alokasi kata kunci yang sedikit ditingkatkan sehingga kelasnya seimbang. Versi kumpulan data ini sesuai dengan hasil pada Lampiran D makalah kami. v6 berisi 2.000 gambar.
Ukuran unduhan :
5.87 MiB
Ukuran kumpulan data :
4.40 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.000 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):