- توضیحات :
RL Unplugged مجموعه ای از معیارها برای یادگیری تقویتی آفلاین است. RL Unplugged بر اساس ملاحظات زیر طراحی شده است: برای سهولت استفاده، مجموعه دادهها را با یک API یکپارچه ارائه میکنیم که کار با تمام دادههای مجموعه را پس از ایجاد خط لوله عمومی برای پزشک آسان میکند.
مجموعه داده ها از فرمت RLDS پیروی می کنند تا مراحل و قسمت ها را نشان دهند.
نمونههایی در مجموعه داده نشاندهنده انتقال SAR ذخیرهشده هنگام اجرای یک عامل آموزشدیده آنلاین است که در https://arxiv.org/abs/1904.12901 توضیح داده شده است . /rlds#dataset-format
ما 40 مجموعه داده را روی 8 کار در مجموع منتشر میکنیم - بدون چالش ترکیبی و چالش ترکیبی آسان در کارترپل، واکر، چهارپا و انساننما. هر کار شامل 5 اندازه مختلف از مجموعه داده ها، 1٪، 5٪، 20٪، 40٪ و 100٪ است. توجه داشته باشید که مجموعه داده کوچکتر تضمین نمیشود که زیرمجموعهای از مجموعههای بزرگتر باشد. برای جزئیات بیشتر در مورد نحوه تولید مجموعه داده، لطفاً به مقاله مراجعه کنید.
صفحه اصلی : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
کد منبع :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
نسخه ها :
-
1.0.0
: انتشار اولیه. -
1.0.1
(پیشفرض): اشکالی را در مجموعه داده RLU RWRL که در آن شناسههای قسمت تکراری در یکی از مجموعه دادههای انساننما وجود دارد، رفع میکند.
-
اندازه دانلود :
Unknown size
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (پیکربندی پیشفرض)
حجم مجموعه داده :
172.43 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
حجم مجموعه داده :
862.13 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 25 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
حجم مجموعه داده :
3.37 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 100 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
حجم مجموعه داده :
6.74 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
حجم مجموعه داده :
16.84 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 500 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
حجم مجموعه داده :
1.77 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_5_درصد
حجم مجموعه داده :
8.86 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 25 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_20_درصد
حجم مجموعه داده :
35.46 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 100 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_40_درصد
حجم مجموعه داده :
70.92 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
حجم مجموعه داده :
177.29 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 500 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
حجم مجموعه داده :
6.27 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 50 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
حجم مجموعه داده :
31.34 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 250 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
حجم مجموعه داده :
125.37 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
حجم مجموعه داده :
250.75 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
حجم مجموعه داده :
626.86 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
حجم مجموعه داده :
69.40 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
حجم مجموعه داده :
346.98 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
حجم مجموعه داده :
1.36 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 4000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
حجم مجموعه داده :
2.71 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 8000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
حجم مجموعه داده :
6.78 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 20000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
حجم مجموعه داده :
369.84 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
حجم مجموعه داده :
1.81 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 25 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
حجم مجموعه داده :
7.22 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 100 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
حجم مجموعه داده :
14.45 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
حجم مجموعه داده :
36.12 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 500 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (1،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / موقعیت | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (2،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_1_درصد
حجم مجموعه داده :
1.97 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_5_درصد
حجم مجموعه داده :
9.83 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 25 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_20_درصد
حجم مجموعه داده :
39.31 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 100 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_40_درصد
حجم مجموعه داده :
78.63 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_100_درصد
حجم مجموعه داده :
196.57 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 500 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (12،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل/مشاهده/حالت_خودمحور | تانسور | (44،) | float32 | |
مراحل/مشاهده/نیروی_گشتاور | تانسور | (24،) | float32 | |
مراحل/مشاهده/ایمو | تانسور | (6،) | float32 | |
پلهها/مشاهده/تنه_ایستاده | تانسور | (1،) | float32 | |
مراحل/مشاهده/سرعت_تنه | تانسور | (3،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
حجم مجموعه داده :
8.20 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 50 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
حجم مجموعه داده :
40.98 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 250 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
حجم مجموعه داده :
163.93 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
حجم مجموعه داده :
327.86 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
حجم مجموعه داده :
819.65 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (6،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
پله ها / مشاهده / ارتفاع | تانسور | (1،) | float32 | |
مراحل / مشاهده / جهت گیری | تانسور | (14،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (9،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
حجم مجموعه داده :
77.11 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 200 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
حجم مجموعه داده :
385.54 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
مراحل/مشاهده/ساختگی-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
حجم مجموعه داده :
1.51 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 4000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
حجم مجموعه داده :
3.01 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 8000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
حجم مجموعه داده :
7.53 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 20000 |
- ساختار ویژگی :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_بازگشت | تانسور | float32 | ||
مراحل | مجموعه داده | |||
مراحل/عمل | تانسور | (21،) | float32 | |
مراحل/تخفیف | تانسور | (1،) | float32 | |
Steps/is_first | تانسور | بوول | ||
Steps/is_last | تانسور | بوول | ||
Steps/is_terminal | تانسور | بوول | ||
مراحل / مشاهده | FeaturesDict | |||
steps/observation/com_velocity | تانسور | (3،) | float32 | |
Steps/Reservation/Dummy-0 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-1 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-2 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-3 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-4 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-5 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-6 | تانسور | (1،) | float32 | |
مراحل / مشاهده / ساختگی-7 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-8 | تانسور | (1،) | float32 | |
Steps/Reservation/Dummy-9 | تانسور | (1،) | float32 | |
مراحل / مشاهده / اندام ها | تانسور | (12،) | float32 | |
مراحل/مشاهده/هد_ارتفاع | تانسور | (1،) | float32 | |
مراحل/مشاهده/زوایای_مشترک | تانسور | (21،) | float32 | |
steps/observation/torso_vertical | تانسور | (3،) | float32 | |
مراحل / مشاهده / سرعت | تانسور | (27،) | float32 | |
مراحل/پاداش | تانسور | (1،) | float32 |
- مثالها ( tfds.as_dataframe ):