mt_opt

  • توضیحات :

مجموعه داده ها برای کاغذ MT-Opt .

@misc{kalashnikov2021mtopt,
      title
={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author
={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year
={2021},
      eprint
={2104.08212},
      archivePrefix
={arXiv},
      primaryClass
={cs.RO}
}

mt_opt/rlds (پیکربندی پیش فرض)

  • توضیحات پیکربندی : این مجموعه داده شامل قسمت‌های کار جمع‌آوری‌شده در مجموعه‌ای از روبات‌های واقعی است. برای نمایش مراحل و قسمت ها از فرمت RLDS پیروی می کند.

  • اندازه مجموعه داده : 4.38 TiB

  • تقسیم ها :

شکاف مثال ها
'train' 920,165
  • ساختار ویژگی :
FeaturesDict({
   
'episode_id': string,
   
'skill': uint8,
   
'steps': Dataset({
       
'action': FeaturesDict({
           
'close_gripper': bool,
           
'open_gripper': bool,
           
'target_pose': Tensor(shape=(7,), dtype=float32),
           
'terminate': bool,
       
}),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'observation': FeaturesDict({
           
'gripper_closed': bool,
           
'height_to_bottom': float32,
           
'image': Image(shape=(512, 640, 3), dtype=uint8),
           
'state_dense': Tensor(shape=(7,), dtype=float32),
       
}),
   
}),
   
'task_code': string,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_id تانسور رشته
مهارت تانسور uint8
مراحل مجموعه داده
مراحل/عمل FeaturesDict
Steps/Action/close_gripper تانسور بوول
Steps/Action/open_gripper تانسور بوول
Steps/Action/target_pose تانسور (7،) float32
مراحل / اقدام / خاتمه تانسور بوول
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/gripper_closed تانسور بوول
steps/observation/height_to_bottom تانسور float32
مراحل / مشاهده / تصویر تصویر (512, 640, 3) uint8
steps/observation/state_nse تانسور (7،) float32
task_code تانسور رشته

mt_opt/sd

  • شرح پیکربندی : مجموعه داده آشکارسازهای موفقیت که شامل تعاریف مدیریت شده توسط انسان از تکمیل وظایف است.

  • حجم مجموعه داده : 548.56 GiB

  • تقسیم ها :

شکاف مثال ها
'test' 94,636
'train' 380234
  • ساختار ویژگی :
FeaturesDict({
   
'image_0': Image(shape=(512, 640, 3), dtype=uint8),
   
'image_1': Image(shape=(480, 640, 3), dtype=uint8),
   
'image_2': Image(shape=(480, 640, 3), dtype=uint8),
   
'success': bool,
   
'task_code': string,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
image_0 تصویر (512, 640, 3) uint8
image_1 تصویر (480، 640، 3) uint8
image_2 تصویر (480، 640، 3) uint8
موفقیت تانسور بوول
task_code تانسور رشته