imagenet_pi

  • תיאור :

ImageNet-PI היא גרסה מסומנת מחדש של מערך הנתונים הסטנדרטי ILSVRC2012 ImageNet שבו התוויות מסופקות על ידי אוסף של 16 רשתות עצביות עמוקות עם ארכיטקטורות שונות שהוכשרו מראש על התקן ILSVRC2012. באופן ספציפי, המודלים שהוכשרו מראש מורידים מ-tf.keras.applications.

בנוסף לתוויות החדשות, ImageNet-PI מספקת גם מטא-נתונים על תהליך ההערה בצורה של אמונות של הדגמים על התוויות שלהם ומידע נוסף על כל דגם.

למידע נוסף ראה: ImageNet-PI

  • דף הבית : https://github.com/google-research-datasets/imagenet_pi/

  • קוד מקור : tfds.datasets.imagenet_pi.Builder

  • גרסאות :

    • 1.0.0 (ברירת מחדל): שחרור ראשוני.
  • גודל הורדה : Unknown size

  • גודל ערכת נתונים : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir צריך להכיל שני קבצים: ILSVRC2012_img_train.tar ו-ILSVRC2012_img_val.tar. עליך להירשם בכתובת http://www.image-net.org/download-images כדי לקבל את הקישור להורדת מערך הנתונים.

  • שמור אוטומטי במטמון ( תיעוד ): לא ידוע

  • פיצולים :

לְפַצֵל דוגמאות
  • מבנה תכונה :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
annotator_confidences מוֹתֵחַ (16,) לצוף32
הערות_תוויות מוֹתֵחַ (16,) int64
נקי_תווית ClassLabel int64
שם קובץ טֶקסט חוּט
תמונה תמונה (אין, אין, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • תיאור :

ImageNet-PI היא גרסה מסומנת מחדש של מערך הנתונים הסטנדרטי ILSVRC2012 ImageNet שבו התוויות מסופקות על ידי אוסף של 16 רשתות עצביות עמוקות עם ארכיטקטורות שונות שהוכשרו מראש על התקן ILSVRC2012. באופן ספציפי, המודלים שהוכשרו מראש מורידים מ-tf.keras.applications.

בנוסף לתוויות החדשות, ImageNet-PI מספקת גם מטא-נתונים על תהליך ההערה בצורה של אמונות של הדגמים על התוויות שלהם ומידע נוסף על כל דגם.

למידע נוסף ראה: ImageNet-PI

  • דף הבית : https://github.com/google-research-datasets/imagenet_pi/

  • קוד מקור : tfds.datasets.imagenet_pi.Builder

  • גרסאות :

    • 1.0.0 (ברירת מחדל): שחרור ראשוני.
  • גודל הורדה : Unknown size

  • גודל ערכת נתונים : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir צריך להכיל שני קבצים: ILSVRC2012_img_train.tar ו-ILSVRC2012_img_val.tar. עליך להירשם בכתובת http://www.image-net.org/download-images כדי לקבל את הקישור להורדת מערך הנתונים.

  • שמור אוטומטי במטמון ( תיעוד ): לא ידוע

  • פיצולים :

לְפַצֵל דוגמאות
  • מבנה תכונה :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
annotator_confidences מוֹתֵחַ (16,) לצוף32
הערות_תוויות מוֹתֵחַ (16,) int64
נקי_תווית ClassLabel int64
שם קובץ טֶקסט חוּט
תמונה תמונה (אין, אין, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}