イメージネットpi

  • 説明

ImageNet-PIは、標準ILSVRC2012 ImageNetデータセットのラベル付けバージョンです。ラベルは、標準ILSVRC2012で事前学習済みの、異なるアーキテクチャを持つ16個のディープニューラルネットワークのコレクションによって提供されます。具体的には、事前学習済みモデルはtf.keras.applicationsからダウンロードされます。

新しいラベルに加えて、ImageNet-PI は、ラベルに対するモデルの信頼度や各モデルに関する追加情報の形で、注釈付けプロセスに関するメタデータも提供します。

詳細については、 ImageNet-PIを参照してください。

  • ホームページ: https://github.com/google-research-datasets/imagenet_pi/

  • ソースコード: tfds.datasets.imagenet_pi.Builder

  • バージョン:

    • 1.0.0 (デフォルト): 最初のリリース。
  • ダウンロードサイズ: Unknown size

  • データセットのサイズ: Unknown size

  • 手動ダウンロード手順: このデータセットでは、ソースデータを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dirには、ILSVRC2012_img_train.tarとILSVRC2012_img_val.tarという2つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 http://www.image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュドキュメント): 不明

  • 分割:

スプリット
  • 機能構造:
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
機能辞書
注釈者の信頼テンソル(16) float32
注釈ラベルテンソル(16) int64
クリーンラベルクラスラベルint64
ファイル名文章
画像画像(なし、なし、3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}