mt_opt

  • Описание :

Наборы данных для статьи MT-Opt .

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (конфигурация по умолчанию)

  • Описание конфигурации : этот набор данных содержит эпизоды задач, собранные для множества реальных роботов. Он соответствует формату RLDS для представления шагов и эпизодов.

  • Размер набора данных : 4.38 TiB

  • Сплиты :

Расколоть Примеры
'train' 920 165
  • Структура функции :
FeaturesDict({
    'episode_id': tf.string,
    'skill': tf.uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': tf.bool,
            'open_gripper': tf.bool,
            'target_pose': Tensor(shape=(7,), dtype=tf.float32),
            'terminate': tf.bool,
        }),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'gripper_closed': tf.bool,
            'height_to_bottom': tf.float32,
            'image': Image(shape=(512, 640, 3), dtype=tf.uint8),
            'state_dense': Tensor(shape=(7,), dtype=tf.float32),
        }),
    }),
    'task_code': tf.string,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
id_эпизода Тензор tf.string
навык Тензор tf.uint8
шаги Набор данных
шаги/действие ОсобенностиDict
шаги/действие/close_gripper Тензор tf.bool
шаги/действие/open_gripper Тензор tf.bool
шаги/действие/target_pose Тензор (7,) tf.float32
шаги/действие/завершение Тензор tf.bool
шаги / is_first Тензор tf.bool
шаги/is_last Тензор tf.bool
шаги/is_terminal Тензор tf.bool
шаги/наблюдение ОсобенностиDict
шаги/наблюдение/Gripper_closed Тензор tf.bool
шаги/наблюдение/height_to_bottom Тензор tf.float32
шаги/наблюдение/изображение Изображение (512, 640, 3) tf.uint8
шаги/наблюдение/state_dense Тензор (7,) tf.float32
код_задачи Тензор tf.string

mt_opt/sd

  • Описание конфигурации : набор данных детекторов успеха, который содержит созданные человеком определения выполнения задач.

  • Размер набора данных : 548.56 GiB .

  • Сплиты :

Расколоть Примеры
'test' 94 636
'train' 380 234
  • Структура функции :
FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=tf.uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=tf.uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=tf.uint8),
    'success': tf.bool,
    'task_code': tf.string,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
image_0 Изображение (512, 640, 3) tf.uint8
image_1 Изображение (480, 640, 3) tf.uint8
image_2 Изображение (480, 640, 3) tf.uint8
успех Тензор tf.bool
код_задачи Тензор tf.string