mt_opt

  • الوصف :

مجموعات البيانات لورقة MT-Opt .

@misc{kalashnikov2021mtopt,
      title
={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author
={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year
={2021},
      eprint
={2104.08212},
      archivePrefix
={arXiv},
      primaryClass
={cs.RO}
}

mt_opt / rlds (التكوين الافتراضي)

  • وصف التكوين : تحتوي مجموعة البيانات هذه على حلقات مهمة تم جمعها عبر مجموعة من الروبوتات الحقيقية. يتبع تنسيق RLDS لتمثيل الخطوات والحلقات.

  • حجم مجموعة البيانات : 4.38 TiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 920165
  • هيكل الميزة :
FeaturesDict({
   
'episode_id': string,
   
'skill': uint8,
   
'steps': Dataset({
       
'action': FeaturesDict({
           
'close_gripper': bool,
           
'open_gripper': bool,
           
'target_pose': Tensor(shape=(7,), dtype=float32),
           
'terminate': bool,
       
}),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'observation': FeaturesDict({
           
'gripper_closed': bool,
           
'height_to_bottom': float32,
           
'image': Image(shape=(512, 640, 3), dtype=uint8),
           
'state_dense': Tensor(shape=(7,), dtype=float32),
       
}),
   
}),
   
'task_code': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر سلسلة
مهارة موتر uint8
خطوات مجموعة البيانات
خطوات / عمل الميزات
الخطوات / الإجراء / close_gripper موتر منطقي
الخطوات / الإجراء / open_gripper موتر منطقي
الخطوات / الإجراء / target_pose موتر (7 ،) تعويم 32
خطوات / إجراء / إنهاء موتر منطقي
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / قابض مغلق موتر منطقي
الخطوات / الملاحظة / الارتفاع إلى أسفل موتر تعويم 32
خطوات / ملاحظة / صورة صورة (512 ، 640 ، 3) uint8
خطوات / المراقبة / state_dense موتر (7 ،) تعويم 32
مهمة_رمز موتر سلسلة

mt_opt / sd

  • وصف التكوين : مجموعة بيانات أجهزة الكشف عن النجاح التي تحتوي على تعريفات منسقة من قبل الإنسان لإكمال المهام.

  • حجم مجموعة البيانات : 548.56 GiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 94.636
'train' 380234
  • هيكل الميزة :
FeaturesDict({
   
'image_0': Image(shape=(512, 640, 3), dtype=uint8),
   
'image_1': Image(shape=(480, 640, 3), dtype=uint8),
   
'image_2': Image(shape=(480, 640, 3), dtype=uint8),
   
'success': bool,
   
'task_code': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة_0 صورة (512 ، 640 ، 3) uint8
صورة_1 صورة (480 ، 640 ، 3) uint8
صورة_2 صورة (480 ، 640 ، 3) uint8
النجاح موتر منطقي
مهمة_رمز موتر سلسلة