TFDS اکنون از فرمت Croissant 🥐 پشتیبانی می کند! برای دانستن بیشتر مستندات را بخوانید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

rlu_rwrl

توضیحات :

RL Unplugged مجموعه ای از معیارها برای یادگیری تقویتی آفلاین است. RL Unplugged بر اساس ملاحظات زیر طراحی شده است: برای سهولت استفاده، مجموعه داده‌ها را با یک API یکپارچه ارائه می‌کنیم که کار با تمام داده‌های مجموعه را پس از ایجاد خط لوله عمومی برای پزشک آسان می‌کند.

مجموعه داده ها از فرمت RLDS پیروی می کنند تا مراحل و قسمت ها را نشان دهند.

نمونه‌هایی در مجموعه داده نشان‌دهنده انتقال SAR ذخیره‌شده هنگام اجرای یک عامل آموزش‌دیده آنلاین است که در https://arxiv.org/abs/1904.12901 توضیح داده شده است . /rlds#dataset-format

ما 40 مجموعه داده را روی 8 کار در مجموع منتشر می‌کنیم - بدون چالش ترکیبی و چالش ترکیبی آسان در کارترپل، واکر، چهارپا و انسان‌نما. هر کار شامل 5 اندازه مختلف از مجموعه داده ها، 1٪، 5٪، 20٪، 40٪ و 100٪ است. توجه داشته باشید که مجموعه داده کوچک‌تر تضمین نمی‌شود که زیرمجموعه‌ای از مجموعه‌های بزرگ‌تر باشد. برای جزئیات بیشتر در مورد نحوه تولید مجموعه داده، لطفاً به مقاله مراجعه کنید.

صفحه اصلی : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
کد منبع : tfds.rl_unplugged.rlu_rwrl.RluRwrl
نسخه ها :
- 1.0.0 : انتشار اولیه.
- 1.0.1 (پیش‌فرض): اشکالی را در مجموعه داده RLU RWRL که در آن شناسه‌های قسمت تکراری در یکی از مجموعه داده‌های انسان‌نما وجود دارد، رفع می‌کند.
اندازه دانلود : Unknown size
کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (پیکربندی پیش‌فرض)

حجم مجموعه داده : 172.43 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	5

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

حجم مجموعه داده : 862.13 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	25

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

حجم مجموعه داده : 3.37 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	100

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

حجم مجموعه داده : 6.74 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

حجم مجموعه داده : 16.84 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	500

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

حجم مجموعه داده : 1.77 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	5

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_5_درصد

حجم مجموعه داده : 8.86 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	25

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_20_درصد

حجم مجموعه داده : 35.46 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	100

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_هیچ_40_درصد

حجم مجموعه داده : 70.92 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

حجم مجموعه داده : 177.29 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)
تقسیم ها :

شکاف	مثال ها
`'train'`	500

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

حجم مجموعه داده : 6.27 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	50

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

حجم مجموعه داده : 31.34 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	250

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

حجم مجموعه داده : 125.37 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	1000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

حجم مجموعه داده : 250.75 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	2000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

حجم مجموعه داده : 626.86 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	5000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

حجم مجموعه داده : 69.40 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

حجم مجموعه داده : 346.98 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	1000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

حجم مجموعه داده : 1.36 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	4000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

حجم مجموعه داده : 2.71 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	8000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

حجم مجموعه داده : 6.78 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	20000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

حجم مجموعه داده : 369.84 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	5

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
Steps/Reservation/Dummy-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

حجم مجموعه داده : 1.81 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	25

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

حجم مجموعه داده : 7.22 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	100

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

حجم مجموعه داده : 14.45 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

حجم مجموعه داده : 36.12 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	500

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(1،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / موقعیت	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(2،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_1_درصد

حجم مجموعه داده : 1.97 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	5

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_5_درصد

حجم مجموعه داده : 9.83 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	25

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_20_درصد

حجم مجموعه داده : 39.31 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	100

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_40_درصد

حجم مجموعه داده : 78.63 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
Steps/Reservation/Dummy-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/چهارپا_راهپیمایی_ترکیبی_چالش_آسان_100_درصد

حجم مجموعه داده : 196.57 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)
تقسیم ها :

شکاف	مثال ها
`'train'`	500

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(12،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل/مشاهده/حالت_خودمحور	تانسور	(44،)	float32
مراحل/مشاهده/نیروی_گشتاور	تانسور	(24،)	float32
مراحل/مشاهده/ایمو	تانسور	(6،)	float32
پله‌ها/مشاهده/تنه_ایستاده	تانسور	(1،)	float32
مراحل/مشاهده/سرعت_تنه	تانسور	(3،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

حجم مجموعه داده : 8.20 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	50

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

حجم مجموعه داده : 40.98 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	250

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

حجم مجموعه داده : 163.93 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)
تقسیم ها :

شکاف	مثال ها
`'train'`	1000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
Steps/Reservation/Dummy-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

حجم مجموعه داده : 327.86 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	2000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
Steps/Reservation/Dummy-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

حجم مجموعه داده : 819.65 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	5000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(6،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
پله ها / مشاهده / ارتفاع	تانسور	(1،)	float32
مراحل / مشاهده / جهت گیری	تانسور	(14،)	float32
مراحل / مشاهده / سرعت	تانسور	(9،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

حجم مجموعه داده : 77.11 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'train'`	200

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
Steps/Reservation/Dummy-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

حجم مجموعه داده : 385.54 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	1000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
مراحل/مشاهده/ساختگی-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

حجم مجموعه داده : 1.51 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	4000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

حجم مجموعه داده : 3.01 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	8000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

حجم مجموعه داده : 7.53 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	20000

ساختار ویژگی :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
قسمت_بازگشت	تانسور		float32
مراحل	مجموعه داده
مراحل/عمل	تانسور	(21،)	float32
مراحل/تخفیف	تانسور	(1،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	FeaturesDict
steps/observation/com_velocity	تانسور	(3،)	float32
Steps/Reservation/Dummy-0	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-1	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-2	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-3	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-4	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-5	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-6	تانسور	(1،)	float32
مراحل / مشاهده / ساختگی-7	تانسور	(1،)	float32
Steps/Reservation/Dummy-8	تانسور	(1،)	float32
Steps/Reservation/Dummy-9	تانسور	(1،)	float32
مراحل / مشاهده / اندام ها	تانسور	(12،)	float32
مراحل/مشاهده/هد_ارتفاع	تانسور	(1،)	float32
مراحل/مشاهده/زوایای_مشترک	تانسور	(21،)	float32
steps/observation/torso_vertical	تانسور	(3،)	float32
مراحل / مشاهده / سرعت	تانسور	(27،)	float32
مراحل/پاداش	تانسور	(1،)	float32

مثال‌ها ( tfds.as_dataframe ):