dmlab

O conjunto de dados Dmlab contém frames observados pelo agente atuando no ambiente DeepMind Lab, que são anotados pela distância entre o agente e vários objetos presentes no ambiente. O objetivo é avaliar a capacidade de um modelo visual de raciocinar sobre distâncias a partir da entrada visual em ambientes 3D. O conjunto de dados Dmlab consiste em imagens coloridas de 360x480 em 6 classes. As classes são {perto, longe, muito longe} x {recompensa positiva, recompensa negativa} respectivamente.

Dividir Exemplos
'test' 22.735
'train' 65.550
'validation' 22.628
  • Estrutura de recursos :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
nome do arquivo Texto corda
imagem Imagem (360, 480, 3) uint8
etiqueta ClassLabel int64

Visualização

  • Citação :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }