utokyo_xarm_bimanual_converted_externally_to_rlds

  • وصف :

منشفة قابلة للطي ذات إعداد يدوي ثنائي xArm

ينقسم أمثلة
'train' 64
'val' 6
  • هيكل الميزة :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(14,), dtype=float32, description=Robot action, consists of [3x EEF position (L), 3x EEF orientation yaw/pitch/roll (L), 1x gripper open/close position (L), 3x EEF position (R), 3x EEF orientation yaw/pitch/roll (R), 1x gripper open/close position (R)].),
        'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'action_l': Tensor(shape=(7,), dtype=float32, description=Left robot action, consists of [3x EEF position, 3x EEF orientation yaw/pitch/roll].),
            'action_r': Tensor(shape=(7,), dtype=float32, description=Right robot action, consists of [3x EEF position, 3x EEF orientation yaw/pitch/roll, 1x gripper open/close position].),
            'image': Image(shape=(256, 256, 3), dtype=uint8, description=Main camera RGB observation.),
            'pose_l': Tensor(shape=(6,), dtype=float32, description=Left robot end effector pose, consists of [3x EEF position, 3x EEF orientation yaw/pitch/roll].),
            'pose_r': Tensor(shape=(6,), dtype=float32, description=Right robot end effector pose, consists of [3x EEF position, 3x EEF orientation yaw/pitch/roll].),
        }),
        'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
الحلقة_البيانات الوصفية المميزاتDict
Episode_metadata/file_path نص خيط المسار إلى ملف البيانات الأصلي.
خطوات مجموعة البيانات
الخطوات/الإجراء الموتر (14،) float32 عمل الروبوت، يتكون من [3x موضع EEF (L)، 3x EEF اتجاه ياو/ميل/لفة (L)، 1x موضع فتح/إغلاق للمقبض (L)، 3x موضع EEF (R)، 3x اتجاه EEF ياو/ميل/لفة (R)، 1x موضع الفتح/الإغلاق (R)].
الخطوات/الخصم العددية float32 الخصم إذا تم توفيره، الافتراضي هو 1.
الخطوات/is_first الموتر منطقي
الخطوات/is_last الموتر منطقي
الخطوات/is_terminal الموتر منطقي
الخطوات/language_embedding الموتر (512،) float32 تضمين لغة كونا. راجع https://tfhub.dev/google/universal-sentence-encoder-large/5
الخطوات/language_instruction نص خيط تعليم اللغة.
الخطوات/الملاحظة المميزاتDict
الخطوات/الملاحظة/action_l الموتر (7،) float32 يتكون عمل الروبوت الأيسر من [موضع EEF 3x، اتجاه EEF 3x ياو/خطوة/لفة].
الخطوات/الملاحظة/action_r الموتر (7،) float32 يتكون عمل الروبوت الصحيح من [3x موضع EEF، 3x اتجاه EEF انعراج/ميل/تدحرج، 1x موضع فتح/إغلاق للمقبض].
الخطوات/الملاحظة/الصورة صورة (256، 256، 3) uint8 مراقبة الكاميرا الرئيسية RGB.
الخطوات/الملاحظة/pose_l الموتر (6،) float32 وضعية المستجيب النهائي للروبوت الأيسر، تتكون من [3x موضع EEF، 3x اتجاه EEF ياو/خطوة/لفة].
الخطوات/الملاحظة/pose_r الموتر (6،) float32 وضع المستجيب النهائي للروبوت الأيمن، يتكون من [3x موضع EEF، 3x اتجاه EEF ياو/خطوة/لفة].
خطوات/مكافأة العددية float32 مكافأة إذا تم توفيرها، 1 في الخطوة النهائية للعروض التوضيحية.
@misc{matsushima2023weblab,
  title={Weblab xArm Dataset},
  author={Tatsuya Matsushima and Hiroki Furuta and Yusuke Iwasawa and Yutaka Matsuo},
  year={2023},
}