imagenet2012_subset

Imagenet2012Subset adalah subset dari kumpulan data ImageNet ILSVRC 2012 asli. Dataset berbagi set validasi yang sama dengan dataset ImageNet ILSVRC 2012 asli. Namun, set pelatihan disubsampling dengan cara seimbang label. Dalam konfigurasi 1pct , 1%, atau 12811, gambar diambil sampelnya, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 12,8), beberapa kelas secara acak memiliki 1 contoh lebih banyak dari yang lain; dan dalam konfigurasi 10pct , ~10%, atau 128116, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 128), dan beberapa kelas secara acak memiliki 1 contoh lebih banyak dari yang lain.

Ini seharusnya digunakan sebagai tolok ukur untuk pembelajaran semi-diawasi, dan awalnya digunakan dalam makalah SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Beranda : http://image-net.org/

  • Kode sumber : tfds.datasets.imagenet2012_subset.Builder

  • Versi :

    • 2.0.0 : Perbaiki label validasi.
    • 2.0.1 : Perbaikan pengodean. Tidak ada perubahan dari sudut pandang pengguna.
    • 3.0.0 : Perbaiki pewarnaan pada ~12 gambar (CMYK -> RGB). Perbaiki format untuk konsistensi (konversi gambar png tunggal ke Jpeg). Pembacaan generasi lebih cepat langsung dari arsip.

    • 4.0.0 : (belum dipublikasikan)

    • 5.0.0 (default): API split baru ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Penambahan test split.

  • Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default ke ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir harus berisi dua file: ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar. Anda harus mendaftar di https://image-net.org/download-images untuk mendapatkan tautan untuk mengunduh dataset.

  • Di-cache otomatis ( dokumentasi ): Tidak

  • Struktur fitur :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
nama file Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 3) uint8
label LabelKelas int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (konfigurasi default)

  • Deskripsi konfigurasi : 1 persen dari total set pelatihan ImageNet.

  • Ukuran unduhan : 254.22 KiB

  • Ukuran dataset : 7.61 GiB

  • Perpecahan :

Membelah Contoh
'train' 12.811
'validation' 50.000

Visualisasi

imagenet2012_subset/10pct

  • Deskripsi konfigurasi : 10 persen dari total set pelatihan ImageNet.

  • Ukuran unduhan : 2.48 MiB

  • Ukuran dataset : 19.91 GiB

  • Perpecahan :

Membelah Contoh
'train' 128.116
'validation' 50.000

Visualisasi