dmlab

Tập dữ liệu Dmlab chứa các khung được quan sát bởi tác nhân hoạt động trong môi trường DeepMind Lab, được chú thích bởi khoảng cách giữa tác nhân và các đối tượng khác nhau hiện diện trong môi trường. Mục đích là đánh giá khả năng suy luận của một mô hình trực quan về khoảng cách so với đầu vào trực quan trong môi trường 3D. Tập dữ liệu Dmlab bao gồm các hình ảnh màu 360x480 trong 6 lớp. Các lớp lần lượt là {gần, xa, rất xa} x {thưởng dương, thưởng âm}.

Tách ra Các ví dụ
'test' 22.735
'train' 65.550
'validation' 22.628
  • Các tính năng:
FeaturesDict({
    'filename': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(360, 480, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})

Hình dung

  • Trích dẫn:
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }