Visualisasi : Jelajahi di Kenali Data Anda
Deskripsi :
Kumpulan data CIFAR-10.1 adalah kumpulan pengujian baru untuk CIFAR-10. CIFAR-10.1 berisi sekitar 2.000 gambar uji baru yang diambil sampelnya setelah beberapa tahun penelitian pada dataset CIFAR-10 asli. Pengumpulan data untuk CIFAR-10.1 dirancang untuk meminimalkan pergeseran distribusi relatif terhadap kumpulan data asli. Kami menjelaskan pembuatan CIFAR-10.1 dalam makalah "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". Gambar di CIFAR-10.1 adalah bagian dari kumpulan data TinyImages. Saat ini ada dua versi dataset CIFAR-10.1: v4 dan v6.
Kode sumber :
tfds.image_classification.Cifar10_1
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Di-cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
gambar | Gambar | (32, 32, 3) | uint8 | |
label | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('image', 'label')
Kutipan :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (konfigurasi default)
Deskripsi konfigurasi : Ini adalah versi pertama dari kumpulan data kami tempat kami menguji pengklasifikasi apa pun. Seperti disebutkan di atas, ini membuat dataset v4 tidak bergantung pada pengklasifikasi yang kami evaluasi. Angka-angka yang dilaporkan di bagian utama makalah kami menggunakan versi kumpulan data ini. Itu dibangun dari 25 kata kunci TinyImages teratas untuk setiap kelas, yang menyebabkan sedikit ketidakseimbangan kelas. Perbedaan terbesar adalah bahwa kapal hanya menghasilkan 8% dari set pengujian, bukan 10%. v4 berisi 2.021 gambar.
Ukuran unduhan :
5.93 MiB
Ukuran dataset :
4.46 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.021 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
cifar10_1/v6
Deskripsi konfigurasi : Ini berasal dari alokasi kata kunci yang sedikit lebih baik yang benar-benar seimbang kelasnya. Versi dataset ini sesuai dengan hasil dalam Lampiran D makalah kami. v6 berisi 2.000 gambar.
Ukuran unduhan :
5.87 MiB
Ukuran dataset :
4.40 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.000 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):