mt_optar

  • Descripción :

Conjuntos de datos para el artículo MT-Opt .

@misc{kalashnikov2021mtopt,
      title
={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author
={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year
={2021},
      eprint
={2104.08212},
      archivePrefix
={arXiv},
      primaryClass
={cs.RO}
}

mt_opt/rlds (configuración predeterminada)

  • Descripción de la configuración : este conjunto de datos contiene episodios de tareas recopilados en una flota de robots reales. Sigue el formato RLDS para representar pasos y episodios.

  • Tamaño del conjunto de datos : 4.38 TiB

  • Divisiones :

Separar Ejemplos
'train' 920,165
  • Estructura de características :
FeaturesDict({
   
'episode_id': string,
   
'skill': uint8,
   
'steps': Dataset({
       
'action': FeaturesDict({
           
'close_gripper': bool,
           
'open_gripper': bool,
           
'target_pose': Tensor(shape=(7,), dtype=float32),
           
'terminate': bool,
       
}),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'observation': FeaturesDict({
           
'gripper_closed': bool,
           
'height_to_bottom': float32,
           
'image': Image(shape=(512, 640, 3), dtype=uint8),
           
'state_dense': Tensor(shape=(7,), dtype=float32),
       
}),
   
}),
   
'task_code': string,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_id Tensor cuerda
habilidad Tensor uint8
pasos conjunto de datos
pasos/acción CaracterísticasDict
pasos/acción/close_gripper Tensor bool
pasos/acción/open_gripper Tensor bool
pasos/acción/target_pose Tensor (7,) flotar32
pasos/acción/terminar Tensor bool
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/pinza_cerrada Tensor bool
pasos/observación/altura_hasta_el_fondo Tensor flotar32
pasos/observación/imagen Imagen (512, 640, 3) uint8
pasos/observación/estado_denso Tensor (7,) flotar32
código_tarea Tensor cuerda

mt_opt/sd

  • Descripción de configuración : el conjunto de datos de detectores de éxito que contiene definiciones curadas por humanos de finalización de tareas.

  • Tamaño del conjunto de datos : 548.56 GiB

  • Divisiones :

Separar Ejemplos
'test' 94,636
'train' 380,234
  • Estructura de características :
FeaturesDict({
   
'image_0': Image(shape=(512, 640, 3), dtype=uint8),
   
'image_1': Image(shape=(480, 640, 3), dtype=uint8),
   
'image_2': Image(shape=(480, 640, 3), dtype=uint8),
   
'success': bool,
   
'task_code': string,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen_0 Imagen (512, 640, 3) uint8
imagen_1 Imagen (480, 640, 3) uint8
imagen_2 Imagen (480, 640, 3) uint8
éxito Tensor bool
código_tarea Tensor cuerda