dmlab

מערך הנתונים של Dmlab מכיל מסגרות שנצפו על ידי הסוכן הפועל בסביבת DeepMind Lab, אשר מסומנות על ידי המרחק בין הסוכן לבין אובייקטים שונים הנמצאים בסביבה. המטרה היא להעריך את היכולת של מודל חזותי להגיב על מרחקים מהקלט החזותי בסביבות תלת ממדיות. מערך הנתונים של Dmlab מורכב מתמונות צבעוניות בגודל 360x480 ב-6 מחלקות. השיעורים הם {קרוב, רחוק, מאוד רחוק} x {תגמול חיובי, תגמול שלילי} בהתאמה.

לְפַצֵל דוגמאות
'test' 22,735
'train' 65,550
'validation' 22,628
  • מבנה תכונה :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שם קובץ טֶקסט חוּט
תמונה תמונה (360, 480, 3) uint8
תווית ClassLabel int64

רְאִיָה

  • ציטוט :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }