imagenet2012_subset

  • 説明

Imagenet2012Subset は、元の ImageNet ILSVRC 2012 データセットのサブセットです。データセットは、元の ImageNet ILSVRC 2012 データセットと同じ検証セットを共有します。ただし、トレーニング セットはラベルのバランスを保った方法でサブサンプリングされます。 1pct構成では、1%、つまり 12811 個のイメージがサンプリングされ、ほとんどのクラスは同じ数のイメージ (平均 12.8) を持ち、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。 10pct構成 (~10%、つまり 128116) では、ほとんどのクラスに同じ数のイメージ (平均 128) があり、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。

これは半教師あり学習のベンチマークとして使用されることを想定しており、元々は SimCLR の論文 ( https://arxiv.org/abs/2002.05709 ) で使用されていました。

  • ホームページhttp://image-net.org/

  • ソースコード: tfds.datasets.imagenet2012_subset.Builder

  • バージョン:

    • 2.0.0 : 検証ラベルを修正しました。
    • 2.0.1 : エンコーディングを修正しました。ユーザーの観点からは何も変わりません。
    • 3.0.0 : 〜 12 個の画像の色付けを修正 (CMYK -> RGB)。一貫性を保つために形式を修正しました (単一の PNG 画像を Jpeg に変換します)。アーカイブから直接生成を読み取る方が高速になります。

    • 4.0.0 : (未公開)

    • 5.0.0 (デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : テスト分割を追加しました。

  • 手動ダウンロード手順: このデータセットでは、ソース データをdownload_config.manual_dirに手動でダウンロードする必要があります (デフォルトは~/tensorflow_datasets/downloads/manual/ )。
    Manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするリンクを取得するには、 https://image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): いいえ

  • 機能の構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
ファイル名文章
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (デフォルト設定)

  • 構成の説明: ImageNet トレーニング セット全体の 1 パーセント。

  • ダウンロードサイズ: 254.22 KiB

  • データセットのサイズ: 7.61 GiB

  • 分割:

スプリット
'train' 12,811
'validation' 50,000

視覚化

imagenet2012_subset/10pct

  • 構成の説明: ImageNet トレーニング セット全体の 10%。

  • ダウンロードサイズ: 2.48 MiB

  • データセットのサイズ: 19.91 GiB

  • 分割:

スプリット
'train' 128,116
'validation' 50,000

視覚化