dmlab

El conjunto de datos de Dmlab contiene fotogramas observados por el agente que actúa en el entorno de DeepMind Lab, que están anotados por la distancia entre el agente y varios objetos presentes en el entorno. El objetivo es evaluar la capacidad de un modelo visual para razonar acerca de las distancias a partir de la entrada visual en entornos 3D. El conjunto de datos Dmlab consta de imágenes en color de 360x480 en 6 clases. Las clases son {cerca, lejos, muy lejos} x {recompensa positiva, recompensa negativa} respectivamente.

Separar Ejemplos
'test' 22,735
'train' 65,550
'validation' 22,628
  • Estructura de características :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
Nombre del archivo Texto cuerda
imagen Imagen (360, 480, 3) uint8
etiqueta Etiqueta de clase int64

Visualización

  • Cita :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }