rlu_rwrl

  • توضیحات :

RL Unplugged مجموعه ای از معیارها برای یادگیری تقویتی آفلاین است. RL Unplugged بر اساس ملاحظات زیر طراحی شده است: برای سهولت استفاده، مجموعه داده‌ها را با یک API یکپارچه ارائه می‌کنیم که کار با تمام داده‌های مجموعه را پس از ایجاد خط لوله عمومی برای پزشک آسان می‌کند.

مجموعه داده ها از فرمت RLDS پیروی می کنند تا مراحل و قسمت ها را نشان دهند.

نمونه‌هایی در مجموعه داده نشان‌دهنده انتقال SAR ذخیره‌شده هنگام اجرای یک عامل آموزش‌دیده آنلاین است که در https://arxiv.org/abs/1904.12901 توضیح داده شده است . /rlds#dataset-format

ما 40 مجموعه داده را روی 8 کار در مجموع منتشر می‌کنیم - بدون چالش ترکیبی و چالش ترکیبی آسان در کارترپل، واکر، چهارپا و انسان‌نما. هر کار شامل 5 اندازه مختلف از مجموعه داده ها، 1٪، 5٪، 20٪، 40٪ و 100٪ است. توجه داشته باشید که مجموعه داده کوچک‌تر تضمین نمی‌شود که زیرمجموعه‌ای از مجموعه‌های بزرگ‌تر باشد. برای جزئیات بیشتر در مورد نحوه تولید مجموعه داده، لطفاً به مقاله مراجعه کنید.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (پیکربندی پیش‌فرض)

  • حجم مجموعه داده : 172.43 KiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 5
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • حجم مجموعه داده : 862.13 KiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 25
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • حجم مجموعه داده : 3.37 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 100
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • حجم مجموعه داده : 6.74 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • حجم مجموعه داده : 16.84 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 500
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • حجم مجموعه داده : 1.77 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 5
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_5_درصد

  • حجم مجموعه داده : 8.86 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 25
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_20_درصد

  • حجم مجموعه داده : 35.46 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 100
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_40_درصد

  • حجم مجموعه داده : 70.92 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • حجم مجموعه داده : 177.29 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 500
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • حجم مجموعه داده : 6.27 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 50
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • حجم مجموعه داده : 31.34 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 250
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • حجم مجموعه داده : 125.37 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 1000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • حجم مجموعه داده : 250.75 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 2000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • حجم مجموعه داده : 626.86 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 5000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • حجم مجموعه داده : 69.40 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • حجم مجموعه داده : 346.98 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • حجم مجموعه داده : 1.36 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 4000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • حجم مجموعه داده : 2.71 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 8000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • حجم مجموعه داده : 6.78 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 20000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • حجم مجموعه داده : 369.84 KiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 5
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
Steps/Reservation/Dummy-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • حجم مجموعه داده : 1.81 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 25
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • حجم مجموعه داده : 7.22 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 100
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • حجم مجموعه داده : 14.45 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • حجم مجموعه داده : 36.12 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 500
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (1،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / موقعیت تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (2،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_1_درصد

  • حجم مجموعه داده : 1.97 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 5
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_5_درصد

  • حجم مجموعه داده : 9.83 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 25
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_20_درصد

  • حجم مجموعه داده : 39.31 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 100
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_40_درصد

  • حجم مجموعه داده : 78.63 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
Steps/Reservation/Dummy-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_100_درصد

  • حجم مجموعه داده : 196.57 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 500
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (12،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل/مشاهده/حالت_خودمحور تانسور (44،) float32
مراحل/مشاهده/نیروی_گشتاور تانسور (24،) float32
مراحل/مشاهده/ایمو تانسور (6،) float32
پله‌ها/مشاهده/تنه_ایستاده تانسور (1،) float32
مراحل/مشاهده/سرعت_تنه تانسور (3،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • حجم مجموعه داده : 8.20 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 50
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • حجم مجموعه داده : 40.98 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 250
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • حجم مجموعه داده : 163.93 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 1000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
Steps/Reservation/Dummy-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • حجم مجموعه داده : 327.86 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 2000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
Steps/Reservation/Dummy-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • حجم مجموعه داده : 819.65 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 5000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (6،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
پله ها / مشاهده / ارتفاع تانسور (1،) float32
مراحل / مشاهده / جهت گیری تانسور (14،) float32
مراحل / مشاهده / سرعت تانسور (9،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • حجم مجموعه داده : 77.11 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 200
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
Steps/Reservation/Dummy-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • حجم مجموعه داده : 385.54 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
مراحل/مشاهده/ساختگی-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • حجم مجموعه داده : 1.51 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 4000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • حجم مجموعه داده : 3.01 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 8000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • حجم مجموعه داده : 7.53 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 20000
  • ساختار ویژگی :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_بازگشت تانسور float32
مراحل مجموعه داده
مراحل/عمل تانسور (21،) float32
مراحل/تخفیف تانسور (1،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
steps/observation/com_velocity تانسور (3،) float32
Steps/Reservation/Dummy-0 تانسور (1،) float32
مراحل / مشاهده / ساختگی-1 تانسور (1،) float32
مراحل / مشاهده / ساختگی-2 تانسور (1،) float32
مراحل / مشاهده / ساختگی-3 تانسور (1،) float32
مراحل / مشاهده / ساختگی-4 تانسور (1،) float32
مراحل / مشاهده / ساختگی-5 تانسور (1،) float32
مراحل / مشاهده / ساختگی-6 تانسور (1،) float32
مراحل / مشاهده / ساختگی-7 تانسور (1،) float32
Steps/Reservation/Dummy-8 تانسور (1،) float32
Steps/Reservation/Dummy-9 تانسور (1،) float32
مراحل / مشاهده / اندام ها تانسور (12،) float32
مراحل/مشاهده/هد_ارتفاع تانسور (1،) float32
مراحل/مشاهده/زوایای_مشترک تانسور (21،) float32
steps/observation/torso_vertical تانسور (3،) float32
مراحل / مشاهده / سرعت تانسور (27،) float32
مراحل/پاداش تانسور (1،) float32