cifar10_1

  • Tanım :

CIFAR-10.1 veri seti, CIFAR-10 için yeni bir test setidir. CIFAR-10.1, orijinal CIFAR-10 veri seti üzerinde uzun yıllar süren araştırmalardan sonra örneklenen yaklaşık 2.000 yeni test görüntüsünü içerir. CIFAR-10.1 için veri toplama, orijinal veri kümesine göre dağılım kaymasını en aza indirecek şekilde tasarlanmıştır. CIFAR-10.1'in yaratılışını "CIFAR-10 Sınıflandırıcıları CIFAR-10'a Genellenir mi?" makalemizde açıklıyoruz. CIFAR-10.1'deki görüntüler TinyImages veri kümesinin bir alt kümesidir. Şu anda CIFAR-10.1 veri kümesinin iki sürümü bulunmaktadır: v4 ve v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
resim Resim (32, 32, 3) uint8
etiket SınıfEtiketi int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Veri setimizin herhangi bir sınıflandırıcıyı test ettiğimiz ilk sürümüdür. Yukarıda da belirtildiği gibi bu, v4 veri kümesini değerlendirdiğimiz sınıflandırıcılardan bağımsız hale getirir. Makalemizin ana bölümlerinde bildirilen rakamlar veri setinin bu versiyonunu kullanıyor. Her sınıf için en iyi 25 TinyImages anahtar kelimesinden oluşturuldu ve bu da hafif bir sınıf dengesizliğine yol açtı. En büyük fark, gemilerin test setinin %10'u yerine yalnızca %8'ini oluşturmasıdır. v4 2.021 görsel içeriyor.

  • İndirme boyutu : 5.93 MiB

  • Veri kümesi boyutu : 4.46 MiB

  • Bölünmeler :

Bölmek Örnekler
'test' 2.021

Görselleştirme

cifar10_1/v6

  • Yapılandırma açıklaması : Tam olarak sınıf dengeli, biraz geliştirilmiş bir anahtar kelime tahsisinden türetilmiştir. Veri kümesinin bu versiyonu, makalemizin Ek D'sindeki sonuçlara karşılık gelmektedir. v6 2.000 görüntü içerir.

  • İndirme boyutu : 5.87 MiB

  • Veri kümesi boyutu : 4.40 MiB

  • Bölünmeler :

Bölmek Örnekler
'test' 2.000

Görselleştirme