imagenet2012_subset

Keterangan :

Imagenet2012Subset adalah subset dari kumpulan data ImageNet ILSVRC 2012 asli. Kumpulan data tersebut berbagi kumpulan validasi yang sama dengan kumpulan data ImageNet ILSVRC 2012 asli. Namun, set pelatihan disubsampel dengan label yang seimbang. Dalam konfigurasi 1pct , 1%, atau 12811, gambar diambil sampelnya, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 12,8), beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain; dan dalam konfigurasi 10pct , ~10%, atau 128116, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 128), dan beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain.

Hal ini seharusnya digunakan sebagai patokan untuk pembelajaran semi-supervisi, dan awalnya digunakan dalam makalah SimCLR ( https://arxiv.org/abs/2002.05709 ).

Beranda : http://image-net.org/
Kode sumber : tfds.datasets.imagenet2012_subset.Builder
Versi :
- 2.0.0 : Memperbaiki label validasi.
- 2.0.1 : Perbaikan pengkodean. Tidak ada perubahan dari sudut pandang pengguna.
- 3.0.0 : Memperbaiki pewarnaan pada ~12 gambar (CMYK -> RGB). Perbaiki format untuk konsistensi (konversi satu gambar png ke Jpeg). Pembacaan generasi lebih cepat langsung dari arsip.
- 4.0.0 : (tidak dipublikasikan)
- 5.0.0 (default): API terpisah baru ( https://tensorflow.org/datasets/splits )
- 5.1.0 : Menambahkan pemisahan tes.
Petunjuk pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default pada ~/tensorflow_datasets/downloads/manual/ ):
manual_dir harus berisi dua file: ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar. Anda harus mendaftar di https://image-net.org/download-images untuk mendapatkan link untuk mendownload dataset.
Cache otomatis ( dokumentasi ): Tidak
Struktur fitur :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
nama file	Teks		rangkaian
gambar	Gambar	(Tidak ada, Tidak ada, 3)	uint8
label	Label Kelas		int64

Kunci yang diawasi (Lihat dokumen as_supervised ): ('image', 'label')
Kutipan :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}