imagenet2012_subset

  • Keterangan :

Imagenet2012Subset adalah subset dari kumpulan data ImageNet ILSVRC 2012 asli. Kumpulan data tersebut berbagi kumpulan validasi yang sama dengan kumpulan data ImageNet ILSVRC 2012 asli. Namun, set pelatihan disubsampel dengan label yang seimbang. Dalam konfigurasi 1pct , 1%, atau 12811, gambar diambil sampelnya, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 12,8), beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain; dan dalam konfigurasi 10pct , ~10%, atau 128116, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 128), dan beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain.

Hal ini seharusnya digunakan sebagai patokan untuk pembelajaran semi-supervisi, dan awalnya digunakan dalam makalah SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Beranda : http://image-net.org/

  • Kode sumber : tfds.datasets.imagenet2012_subset.Builder

  • Versi :

    • 2.0.0 : Memperbaiki label validasi.
    • 2.0.1 : Perbaikan pengkodean. Tidak ada perubahan dari sudut pandang pengguna.
    • 3.0.0 : Memperbaiki pewarnaan pada ~12 gambar (CMYK -> RGB). Perbaiki format untuk konsistensi (konversi satu gambar png ke Jpeg). Pembacaan generasi lebih cepat langsung dari arsip.

    • 4.0.0 : (tidak dipublikasikan)

    • 5.0.0 (default): API terpisah baru ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Menambahkan pemisahan tes.

  • Petunjuk pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default pada ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir harus berisi dua file: ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar. Anda harus mendaftar di https://image-net.org/download-images untuk mendapatkan link untuk mendownload dataset.

  • Cache otomatis ( dokumentasi ): Tidak

  • Struktur fitur :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
nama file Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 3) uint8
label Label Kelas int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (konfigurasi default)

  • Deskripsi konfigurasi : 1 persen dari total set pelatihan ImageNet.

  • Ukuran unduhan : 254.22 KiB

  • Ukuran kumpulan data : 7.61 GiB

  • Perpecahan :

Membelah Contoh
'train' 12.811
'validation' 50.000

Visualisasi

imagenet2012_subset/10pct

  • Deskripsi konfigurasi : 10 persen dari total set pelatihan ImageNet.

  • Ukuran unduhan : 2.48 MiB

  • Ukuran kumpulan data : 19.91 GiB

  • Perpecahan :

Membelah Contoh
'train' 128.116
'validation' 50.000

Visualisasi