imagenet2012_subset

  • Tanım :

Imagenet2012Subset, orijinal ImageNet ILSVRC 2012 veri kümesinin bir alt kümesidir. Veri kümesi, orijinal ImageNet ILSVRC 2012 veri kümesiyle aynı doğrulama kümesini paylaşır. Ancak eğitim seti etiket dengeli bir şekilde alt örneklenmiştir. 1pct konfigürasyonunda, %1 veya 12811, görüntüler örneklenir, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 12,8), bazı sınıflar rastgele diğerlerinden 1 daha fazla örneğe sahiptir; ve 10pct yapılandırmasında, ~%10 veya 128116, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 128) ve bazı sınıflar rastgele diğerlerinden 1 daha fazla örneğe sahiptir.

Bunun yarı denetimli öğrenme için bir kıyaslama olarak kullanılması gerekiyordu ve orijinal olarak SimCLR makalesinde kullanıldı ( https://arxiv.org/abs/2002.05709 ).

  • Ana sayfa : http://image-net.org/

  • Kaynak kodu : tfds.datasets.imagenet2012_subset.Builder

  • Sürümler :

    • 2.0.0 : Doğrulama etiketlerini düzeltin.
    • 2.0.1 : Kodlama düzeltmesi. Kullanıcı açısından herhangi bir değişiklik yok.
    • 3.0.0 : ~12 görüntüdeki renklendirmeyi düzeltin (CMYK -> RGB). Tutarlılık için formatı düzeltin (tek png görüntüsünü Jpeg'e dönüştürün). Doğrudan arşivden daha hızlı nesil okuma.

    • 4.0.0 : (yayınlanmadı)

    • 5.0.0 (varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Test bölümü eklendi.

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verilerini manuel olarak download_config.manual_dir içine indirmenizi gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ şeklindedir):
    manual_dir iki dosya içermelidir: ILSVRC2012_img_train.tar ve ILSVRC2012_img_val.tar. Veri kümesini indirme bağlantısını almak için https://image-net.org/download-images adresine kaydolmanız gerekir.

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Özellik yapısı :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
dosya adı Metin sicim
resim Resim (Yok, Yok, 3) uint8
etiket SınıfEtiketi int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin 1 kısmı.

  • İndirme boyutu : 254.22 KiB

  • Veri kümesi boyutu : 7.61 GiB

  • Bölünmeler :

Bölmek Örnekler
'train' 12.811
'validation' 50.000

Görselleştirme

imagenet2012_subset/10pct

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin yüzde 10'u.

  • İndirme boyutu : 2.48 MiB

  • Veri kümesi boyutu : 19.91 GiB

  • Bölünmeler :

Bölmek Örnekler
'train' 128.116
'validation' 50.000

Görselleştirme