mt_opt

  • opis :

Zbiory danych dla artykułu MT-Opt .

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (domyślna konfiguracja)

  • Opis konfiguracji: Ten zestaw danych zawiera epizody zadań zebrane z floty prawdziwych robotów. Jest zgodny z formatem RLDS, aby reprezentować kroki i odcinki.

  • Rozmiar zestawu danych : 4.38 TiB

  • Podziały :

Rozdzielać Przykłady
'train' 920165
  • Struktura funkcji :
FeaturesDict({
    'episode_id': string,
    'skill': uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': bool,
            'open_gripper': bool,
            'target_pose': Tensor(shape=(7,), dtype=float32),
            'terminate': bool,
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'gripper_closed': bool,
            'height_to_bottom': float32,
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'state_dense': Tensor(shape=(7,), dtype=float32),
        }),
    }),
    'task_code': string,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_odcinka Napinacz strunowy
umiejętność Napinacz uint8
kroki Zbiór danych
kroki/działanie FunkcjeDict
kroki/akcja/zamknij_chwytak Napinacz bool
kroki/akcja/open_gripper Napinacz bool
kroki/akcja/pozycja_docelowa Napinacz (7,) pływak32
kroki/działanie/zakończ Napinacz bool
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/jest_terminalem Napinacz bool
kroki/obserwacja FunkcjeDict
kroki/obserwacja/chwytak_zamknięty Napinacz bool
kroki/obserwacja/wysokość_do_dna Napinacz pływak32
kroki/obserwacja/obraz Obraz (512, 640, 3) uint8
kroki/obserwacja/state_dense Napinacz (7,) pływak32
kod_zadania Napinacz strunowy

mt_opt/sd

  • Opis konfiguracji : zestaw danych detektorów sukcesów, który zawiera definicje ukończenia zadań opracowane przez ludzi.

  • Rozmiar zestawu danych : 548.56 GiB

  • Podziały :

Rozdzielać Przykłady
'test' 94636
'train' 380234
  • Struktura funkcji :
FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=uint8),
    'success': bool,
    'task_code': string,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
obraz_0 Obraz (512, 640, 3) uint8
obraz_1 Obraz (480, 640, 3) uint8
obraz_2 Obraz (480, 640, 3) uint8
powodzenie Napinacz bool
kod_zadania Napinacz strunowy