imagenet2012_subset

説明：

Imagenet2012Subset は、元の ImageNet ILSVRC 2012 データセットのサブセットです。データセットは、元の ImageNet ILSVRC 2012 データセットと同じ検証セットを共有します。ただし、トレーニングセットはラベルのバランスを保った方法でサブサンプリングされます。 1pct構成では、1%、つまり 12811 個のイメージがサンプリングされ、ほとんどのクラスは同じ数のイメージ (平均 12.8) を持ち、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。 10pct構成 (~10%、つまり 128116) では、ほとんどのクラスに同じ数のイメージ (平均 128) があり、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。

これは半教師あり学習のベンチマークとして使用されることを想定しており、元々は SimCLR の論文 ( https://arxiv.org/abs/2002.05709 ) で使用されていました。

ホームページ： http://image-net.org/
ソースコード: tfds.datasets.imagenet2012_subset.Builder
バージョン:
- 2.0.0 : 検証ラベルを修正しました。
- 2.0.1 : エンコーディングを修正しました。ユーザーの観点からは何も変わりません。
- 3.0.0 : 〜 12 個の画像の色付けを修正 (CMYK -> RGB)。一貫性を保つために形式を修正しました (単一の PNG 画像を Jpeg に変換します)。アーカイブから直接生成を読み取る方が高速になります。
- 4.0.0 : (未公開)
- 5.0.0 (デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits )
- 5.1.0 : テスト分割を追加しました。
手動ダウンロード手順: このデータセットでは、ソースデータをdownload_config.manual_dirに手動でダウンロードする必要があります (デフォルトは~/tensorflow_datasets/downloads/manual/ )。
Manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするリンクを取得するには、 https://image-net.org/download-imagesに登録する必要があります。
自動キャッシュ(ドキュメント): いいえ
機能の構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ファイル名	文章		弦
画像	画像	(なし、なし、3)	uint8
ラベル	クラスラベル		int64

監視キー( as_supervised doc を参照): ('image', 'label')
引用：

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}