dmlab

  • Opis :

Zbiór danych Dmlab zawiera ramki zaobserwowane przez agenta działającego w środowisku DeepMind Lab, które są opatrzone adnotacją odległości pomiędzy agentem a różnymi obiektami obecnymi w środowisku. Celem jest ocena zdolności modelu wizualnego do wnioskowania o odległościach od sygnału wejściowego w środowiskach 3D. Zbiór danych Dmlab składa się z kolorowych obrazów 360x480 w 6 klasach. Klasy to odpowiednio {blisko, daleko, bardzo daleko} x {pozytywna nagroda, negatywna nagroda}.

Podział Przykłady
'test' 22735
'train' 65550
'validation' 22628
  • Struktura funkcji :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
Nazwa pliku Tekst strunowy
obraz Obraz (360, 480, 3) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

  • Cytat :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }