dmlab

  • شرح :

مجموعه داده Dmlab شامل فریم هایی است که توسط عاملی که در محیط آزمایشگاه DeepMind عمل می کند مشاهده شده است، که با فاصله بین عامل و اشیاء مختلف موجود در محیط حاشیه نویسی می شود. هدف، ارزیابی توانایی یک مدل بصری برای استدلال در مورد فواصل از ورودی بصری در محیط های سه بعدی است. مجموعه داده Dmlab از تصاویر رنگی 360x480 در 6 کلاس تشکیل شده است. کلاس ها به ترتیب {نزدیک، دور، خیلی دور} x {پاداش مثبت، پاداش منفی} هستند.

شکاف مثال ها
'test' 22735
'train' 65550
'validation' 22628
  • ساختار ویژگی :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
نام فایل متن رشته
تصویر تصویر (360، 480، 3) uint8
برچسب ClassLabel int64

تجسم

  • نقل قول :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }