- شرح :
مجموعه داده Dmlab شامل فریم هایی است که توسط عاملی که در محیط آزمایشگاه DeepMind عمل می کند مشاهده شده است، که با فاصله بین عامل و اشیاء مختلف موجود در محیط حاشیه نویسی می شود. هدف، ارزیابی توانایی یک مدل بصری برای استدلال در مورد فواصل از ورودی بصری در محیط های سه بعدی است. مجموعه داده Dmlab از تصاویر رنگی 360x480 در 6 کلاس تشکیل شده است. کلاس ها به ترتیب {نزدیک، دور، خیلی دور} x {پاداش مثبت، پاداش منفی} هستند.
صفحه اصلی : https://github.com/google-research/task_adaptation
کد منبع :
tfds.image_classification.Dmlab
نسخه ها :
-
2.0.1
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
2.81 GiB
حجم مجموعه داده :
3.13 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیمات :
شکاف | مثال ها |
---|---|
'test' | 22735 |
'train' | 65550 |
'validation' | 22628 |
- ساختار ویژگی :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(360, 480, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
نام فایل | متن | رشته | ||
تصویر | تصویر | (360، 480، 3) | uint8 | |
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('image', 'label')
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{zhai2019visual,
title={The Visual Task Adaptation Benchmark},
author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
Michael Tschannen and Marcin Michalski and Olivier Bousquet and
Sylvain Gelly and Neil Houlsby},
year={2019},
eprint={1910.04867},
archivePrefix={arXiv},
primaryClass={cs.CV},
url = {https://arxiv.org/abs/1910.04867}
}