dmlab

Le jeu de données Dmlab contient des trames observées par l'agent agissant dans l'environnement DeepMind Lab, qui sont annotées par la distance entre l'agent et divers objets présents dans l'environnement. L'objectif est d'évaluer la capacité d'un modèle visuel à raisonner sur les distances à partir de l'entrée visuelle dans des environnements 3D. Le jeu de données Dmlab se compose d'images couleur 360x480 en 6 classes. Les classes sont respectivement {proche, loin, très loin} x {récompense positive, récompense négative}.

Diviser Exemples
'test' 22 735
'train' 65 550
'validation' 22 628
  • Structure des fonctionnalités :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
nom de fichier Texte chaîne de caractères
image Image (360, 480, 3) uint8
étiquette Étiquette de classe int64

Visualisation

  • Citation :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }