TFDS اکنون از فرمت Croissant 🥐 پشتیبانی می کند! برای دانستن بیشتر مستندات را بخوانید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

d4rl_antmaze

شرح :

D4RL یک معیار منبع باز برای یادگیری تقویتی آفلاین است. این محیط ها و مجموعه داده های استاندارد شده را برای آموزش و الگوریتم های محک ارائه می کند.

مجموعه داده ها از فرمت RLDS پیروی می کنند تا مراحل و قسمت ها را نشان دهند.

توضیحات پیکربندی : جزئیات بیشتر در مورد کار و نسخه های آن را در https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze ببینید
صفحه اصلی : https://sites.google.com/view/d4rl-anonymous
کد منبع : tfds.d4rl.d4rl_antmaze.D4rlAntmaze
نسخه ها :
- 1.0.0 : انتشار اولیه.
- 1.1.1 (پیش فرض): مجموعه داده v2 اضافه شده است.
ذخیره خودکار ( اسناد ): خیر
ساختار ویژگی :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
مراحل	مجموعه داده
مراحل/عمل	تانسور	(8،)	float32
مراحل/تخفیف	تانسور		float32
مراحل/اطلاعات	FeaturesDict
مراحل/اطلاعات/هدف	تانسور	(2،)	float32
Steps/infos/qpos	تانسور	(15،)	float32
Steps/infos/qvel	تانسور	(14،)	float32
Steps/is_first	تانسور		بوول
Steps/is_last	تانسور		بوول
Steps/is_terminal	تانسور		بوول
مراحل / مشاهده	تانسور	(29،)	float32
مراحل/پاداش	تانسور		float32

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (پیکربندی پیش فرض)

حجم دانلود : 221.76 MiB
حجم مجموعه داده : 274.83 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	10,154

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/umaze-diverse-v0

حجم دانلود : 220.16 MiB
حجم مجموعه داده : 270.23 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	1,154

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/medium-play-v0

حجم دانلود : 220.40 MiB
حجم مجموعه داده : 275.20 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	10695

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/medium-diverse-v0

حجم دانلود : 220.39 MiB
حجم مجموعه داده : 271.18 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	2924

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/large-diverse-v0

حجم دانلود : 220.47 MiB
حجم مجموعه داده : 273.36 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	7,141

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v0

حجم دانلود : 220.19 MiB
حجم مجموعه داده : 276.61 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	13,458

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/umaze-v2

حجم دانلود : 221.76 MiB
حجم مجموعه داده : 274.83 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	10,154

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/umaze-diverse-v2

حجم دانلود : 220.16 MiB
حجم مجموعه داده : 270.20 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	1036

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/medium-play-v2

حجم دانلود : 220.40 MiB
حجم مجموعه داده : 275.22 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	10768

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/medium-diverse-v2

حجم دانلود : 220.39 MiB
حجم مجموعه داده : 271.19 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	2959

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/large-diverse-v2

حجم دانلود : 220.47 MiB
حجم مجموعه داده : 273.38 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	7,189

مثال‌ها ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v2

حجم دانلود : 220.18 MiB
حجم مجموعه داده : 276.63 MiB
تقسیم ها :

شکاف	مثال ها
`'train'`	13,517

مثال‌ها ( tfds.as_dataframe ):