cifar10_1

CIFAR-10.1 veri seti, CIFAR-10 için yeni bir test setidir. CIFAR-10.1, orijinal CIFAR-10 veri seti üzerinde uzun yıllar süren araştırmalardan sonra örneklenmiş yaklaşık 2.000 yeni test görüntüsü içerir. CIFAR-10.1 için veri toplama, orijinal veri kümesine göre dağılım kaymasını en aza indirecek şekilde tasarlanmıştır. CIFAR-10.1'in oluşturulmasını "CIFAR-10 Sınıflandırıcıları CIFAR-10'a Genelliyor mu?" başlıklı makalede açıklıyoruz. CIFAR-10.1'deki görüntüler, TinyImages veri kümesinin bir alt kümesidir. Şu anda CIFAR-10.1 veri setinin iki versiyonu bulunmaktadır: v4 ve v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
görüntü resim (32, 32, 3) uint8
etiket SınıfEtiketi int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Üzerinde herhangi bir sınıflandırıcıyı test ettiğimiz veri kümemizin ilk sürümüdür. Yukarıda bahsedildiği gibi bu, v4 veri setini değerlendirdiğimiz sınıflandırıcılardan bağımsız kılar. Makalemizin ana bölümlerinde bildirilen sayılar, veri setinin bu versiyonunu kullanır. Her sınıf için en iyi 25 TinyImages anahtar kelimesinden oluşturuldu ve bu da hafif bir sınıf dengesizliğine yol açtı. En büyük fark, gemilerin test setinin %10 yerine sadece %8'ini oluşturmasıdır. v4 2.021 resim içerir.

  • İndirme boyutu : 5.93 MiB

  • Veri kümesi boyutu : 4.46 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.021

görselleştirme

cifar10_1/v6

  • Yapılandırma açıklaması : Tam olarak sınıf dengeli olan, biraz geliştirilmiş bir anahtar kelime tahsisinden türetilmiştir. Veri setinin bu versiyonu, makalemizin Ek D'sindeki sonuçlara karşılık gelir. v6 2.000 resim içerir.

  • İndirme boyutu : 5.87 MiB

  • Veri kümesi boyutu : 4.40 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000

görselleştirme