cifar10_1

CIFAR-10.1 veri seti, CIFAR-10 için yeni bir test setidir. CIFAR-10.1, orijinal CIFAR-10 veri seti üzerinde uzun yıllar süren araştırmalardan sonra örneklenen yaklaşık 2.000 yeni test görüntüsü içerir. CIFAR-10.1 için veri toplama, orijinal veri kümesine göre dağılım kaymasını en aza indirecek şekilde tasarlanmıştır. CIFAR-10.1'in oluşturulmasını "CIFAR-10 Sınıflandırıcıları CIFAR-10'a Genelliyor mu?" başlıklı makalemizde anlatıyoruz. CIFAR-10.1'deki görüntüler, TinyImages veri kümesinin bir alt kümesidir. Şu anda CIFAR-10.1 veri setinin iki versiyonu bulunmaktadır: v4 ve v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
resim resim (32, 32, 3) tf.uint8
etiket sınıf etiketi tf.int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Herhangi bir sınıflandırıcıyı test ettiğimiz veri setimizin ilk sürümüdür. Yukarıda bahsedildiği gibi bu, v4 veri setini değerlendirdiğimiz sınıflandırıcılardan bağımsız hale getirir. Makalemizin ana bölümlerinde bildirilen sayılar, veri kümesinin bu sürümünü kullanır. Her sınıf için en iyi 25 TinyImages anahtar kelimesinden oluşturuldu ve bu da hafif bir sınıf dengesizliğine yol açtı. En büyük fark, gemilerin test setinin %10 yerine sadece %8'ini oluşturmasıdır. v4, 2.021 resim içerir.

  • İndirme boyutu : 5.93 MiB

  • Veri kümesi boyutu : 4.46 MiB

  • Bölmeler :

Bölmek Örnekler
'test' 2.021

cifar10_1/v6

  • Yapılandırma açıklaması : Tam olarak sınıf dengeli olan biraz geliştirilmiş bir anahtar kelime tahsisinden türetilmiştir. Veri setinin bu versiyonu, makalemizin Ek D'sindeki sonuçlara karşılık gelmektedir. v6 2.000 görüntü içerir.

  • İndirme boyutu : 5.87 MiB

  • Veri kümesi boyutu : 4.40 MiB

  • Bölmeler :

Bölmek Örnekler
'test' 2.000