imagenet_pi

  • Tanım :

ImageNet-PI, standart ILSVRC2012 ImageNet veri setinin yeniden etiketlenmiş bir versiyonudur ve etiketler, standart ILSVRC2012 üzerinde önceden eğitilmiş farklı mimarilere sahip 16 derin sinir ağından oluşan bir koleksiyon tarafından sağlanır. Özellikle, önceden eğitilmiş modeller tf.keras.applications adresinden indirilir.

Yeni etiketlere ek olarak, ImageNet-PI ayrıca modellerin etiketlerine olan güven düzeyleri ve her model hakkında ek bilgiler şeklinde, açıklama süreciyle ilgili meta veriler de sağlar.

Daha fazla bilgi için bkz: ImageNet-PI

  • Ana sayfa : https://github.com/google-research-datasets/imagenet_pi/

  • Kaynak kod : tfds.datasets.imagenet_pi.Builder

  • Sürümler :

    • 1.0.0 (varsayılan): İlk sürüm.
  • İndirme boyutu : Unknown size

  • Veri kümesi boyutu : Unknown size

  • Manuel indirme talimatları : Bu veri seti, kaynak verileri manuel olarak download_config.manual_dir klasörüne (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ) indirmenizi gerektirir:
    manual_dir klasörü iki dosya içermelidir: ILSVRC2012_img_train.tar ve ILSVRC2012_img_val.tar. Veri setini indirmek için gerekli bağlantıyı almak üzere http://www.image-net.org/download-images adresine kayıt olmanız gerekmektedir.

  • Otomatik önbelleğe alınmış ( belgeleme ): Bilinmiyor

  • Bölünmeler :

Bölmek Örnekler
  • Özellik yapısı :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Özellik dokümantasyonu :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerSözlüğü
açıklama_güvenleri Tensör (16,) float32
açıklama etiketleri Tensör (16,) int64
temiz etiket Sınıf Etiketi int64
dosya adı Metin sicim
resim Görüntü (Hiçbiri, Hiçbiri, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}