imagenet2012_subset

Imagenet2012Subset, orijinal ImageNet ILSVRC 2012 veri setinin bir alt kümesidir. Veri seti, orijinal ImageNet ILSVRC 2012 veri seti ile aynı doğrulama setini paylaşır. Bununla birlikte, eğitim seti, etiket dengeli bir şekilde alt örneklenir. 1pct yapılandırmasında, %1 veya 12811, görüntüler örneklenir, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 12,8), bazı sınıfların diğerlerinden rastgele 1 örneği daha vardır; ve 10pct konfigürasyonda, ~%10 veya 128116, çoğu sınıf aynı sayıda resme (ortalama 128) sahiptir ve bazı sınıfların diğerlerinden rastgele 1 örneği daha vardır.

Bunun yarı denetimli öğrenme için bir ölçüt olarak kullanılması gerekiyordu ve orijinal olarak SimCLR makalesinde kullanıldı ( https://arxiv.org/abs/2002.05709 ).

  • Ana sayfa : http://image-net.org/

  • Kaynak kodu : tfds.datasets.imagenet2012_subset.Builder

  • sürümler :

    • 2.0.0 : Doğrulama etiketlerini düzeltin.
    • 2.0.1 : Kodlama düzeltmesi. Kullanıcı açısından değişiklik yok.
    • 3.0.0 : ~12 görüntüde renklendirmeyi düzeltin (CMYK -> RGB). Tutarlılık için biçimi düzeltin (tek png görüntüsünü Jpeg'e dönüştürün). Doğrudan arşivden daha hızlı nesil okuma.

    • 4.0.0 : (yayınlanmadı)

    • 5.0.0 (varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Test bölümü eklendi.

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine indirmenizi gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ şeklindedir):
    manual_dir iki dosya içermelidir: ILSVRC2012_img_train.tar ve ILSVRC2012_img_val.tar. Veri setini indirme bağlantısını almak için https://image-net.org/download-images adresinden kayıt olmanız gerekmektedir.

  • Otomatik önbelleğe alınmış ( belgeleme ): Hayır

  • Özellik yapısı :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
dosya adı Metin sicim
resim resim (Yok, Yok, 3) uint8
etiket SınıfEtiketi int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin yüzde 1'i.

  • İndirme boyutu : 254.22 KiB

  • Veri kümesi boyutu : 7.61 GiB

  • bölmeler :

Bölmek örnekler
'train' 12.811
'validation' 50.000

görselleştirme

imagenet2012_subset/10pct

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin %10'u.

  • İndirme boyutu : 2.48 MiB

  • Veri kümesi boyutu : 19.91 GiB

  • bölmeler :

Bölmek örnekler
'train' 128.116
'validation' 50.000

görselleştirme