aloha_mobile

  • תיאור :

מערך נתונים אמיתי. חיקוי משימות מניפולציה ניידות שהן דו-ידניות ודורשות שליטה על כל הגוף. 50 הדגמות לכל משימה.

לְפַצֵל דוגמאות
'train' 276
  • מבנה תכונה :
FeaturesDict({
   
'episode_metadata': FeaturesDict({
       
'file_path': string,
   
}),
   
'steps': Dataset({
       
'action': Tensor(shape=(16,), dtype=float32),
       
'discount': Scalar(shape=(), dtype=float32),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'language_instruction': string,
       
'observation': FeaturesDict({
           
'cam_high': Image(shape=(480, 640, 3), dtype=uint8),
           
'cam_left_wrist': Image(shape=(480, 640, 3), dtype=uint8),
           
'cam_right_wrist': Image(shape=(480, 640, 3), dtype=uint8),
           
'state': Tensor(shape=(14,), dtype=float32),
       
}),
       
'reward': Scalar(shape=(), dtype=float32),
   
}),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_metadata FeaturesDict
episode_metadata/file_path מוֹתֵחַ חוּט
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (16,) לצוף32
צעדים/הנחה סקלר לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
שלבים/הוראת_שפה מוֹתֵחַ חוּט
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצלמת_גבוהה תמונה (480, 640, 3) uint8
צעדים/תצפית/מצלמת_יד_שמאל תמונה (480, 640, 3) uint8
צעדים/תצפית/מצלמת_יד_ימין תמונה (480, 640, 3) uint8
צעדים/תצפית/מצב מוֹתֵחַ (14,) לצוף32
צעדים/פרס סקלר לצוף32
  • ציטוט :
@inproceedings{fu2024mobile,author = {Fu, Zipeng and Zhao, Tony Z. and Finn, Chelsea},title = {Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation},booktitle = {arXiv},year = {2024},}