- תיאור :
מערכי הנתונים נוצרו עם סוכן SAC שהוכשר על תגמול הסביבה של משימות תנועה של MuJoCo. מערכי נתונים אלה משמשים ב- What Matters for Adversarial Imitation Learning? אורסיני וחב'. 2021 .
מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים
דף הבית : https://github.com/google-research/rlds
קוד מקור :
tfds.rlds.datasets.locomotion.Locomotion
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{orsini2021matters,
title={What Matters for Adversarial Imitation Learning?},
author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
journal={International Conference in Machine Learning},
year={2021}
}
locomotion/ant_sac_1M_single_policy_stochastic (תצורת ברירת המחדל)
תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Ant.
גודל הורדה :
6.49 MiB
גודל ערכת נתונים :
23.02 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 50 |
- מבנה תכונה :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(111,), dtype=float32),
'reward': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
צעדים | מערך נתונים | |||
צעדים/פעולה | מוֹתֵחַ | (8,) | לצוף32 | |
צעדים/הנחה | מוֹתֵחַ | לצוף32 | ||
צעדים/הוא_ראשון | מוֹתֵחַ | bool | ||
צעדים/הוא_אחרון | מוֹתֵחַ | bool | ||
steps/is_terminal | מוֹתֵחַ | bool | ||
צעדים/תצפית | מוֹתֵחַ | (111,) | לצוף32 | |
צעדים/פרס | מוֹתֵחַ | לצוף32 |
- דוגמאות ( tfds.as_dataframe ):
locomotion/hopper_sac_1M_single_policy_stochastic
תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Hopper.
גודל הורדה :
2.26 MiB
גודל ערכת נתונים :
2.62 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 50 |
- מבנה תכונה :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(11,), dtype=float32),
'reward': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
צעדים | מערך נתונים | |||
צעדים/פעולה | מוֹתֵחַ | (3,) | לצוף32 | |
צעדים/הנחה | מוֹתֵחַ | לצוף32 | ||
צעדים/הוא_ראשון | מוֹתֵחַ | bool | ||
צעדים/הוא_אחרון | מוֹתֵחַ | bool | ||
steps/is_terminal | מוֹתֵחַ | bool | ||
צעדים/תצפית | מוֹתֵחַ | (11,) | לצוף32 | |
צעדים/פרס | מוֹתֵחַ | לצוף32 |
- דוגמאות ( tfds.as_dataframe ):
locomotion/halfcheetah_sac_1M_single_policy_stochastic
תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור HalfChetah.
גודל הורדה :
4.49 MiB
גודל ערכת נתונים :
4.93 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 50 |
- מבנה תכונה :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
צעדים | מערך נתונים | |||
צעדים/פעולה | מוֹתֵחַ | (6,) | לצוף32 | |
צעדים/הנחה | מוֹתֵחַ | לצוף32 | ||
צעדים/הוא_ראשון | מוֹתֵחַ | bool | ||
צעדים/הוא_אחרון | מוֹתֵחַ | bool | ||
steps/is_terminal | מוֹתֵחַ | bool | ||
צעדים/תצפית | מוֹתֵחַ | (17,) | לצוף32 | |
צעדים/פרס | מוֹתֵחַ | לצוף32 |
- דוגמאות ( tfds.as_dataframe ):
locomotion/walker2d_sac_1M_single_policy_stochastic
תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Walker2d.
גודל הורדה :
4.35 MiB
גודל ערכת נתונים :
4.91 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 50 |
- מבנה תכונה :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
צעדים | מערך נתונים | |||
צעדים/פעולה | מוֹתֵחַ | (6,) | לצוף32 | |
צעדים/הנחה | מוֹתֵחַ | לצוף32 | ||
צעדים/הוא_ראשון | מוֹתֵחַ | bool | ||
צעדים/הוא_אחרון | מוֹתֵחַ | bool | ||
steps/is_terminal | מוֹתֵחַ | bool | ||
צעדים/תצפית | מוֹתֵחַ | (17,) | לצוף32 | |
צעדים/פרס | מוֹתֵחַ | לצוף32 |
- דוגמאות ( tfds.as_dataframe ):
locomotion/humanoid_sac_15M_single_policy_stochastic
תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-15 מיליון שלבים עבור Humanoid.
גודל הורדה :
192.78 MiB
גודל מערך נתונים :
300.94 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 200 |
- מבנה תכונה :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(17,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(376,), dtype=float32),
'reward': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
צעדים | מערך נתונים | |||
צעדים/פעולה | מוֹתֵחַ | (17,) | לצוף32 | |
צעדים/הנחה | מוֹתֵחַ | לצוף32 | ||
צעדים/הוא_ראשון | מוֹתֵחַ | bool | ||
צעדים/הוא_אחרון | מוֹתֵחַ | bool | ||
steps/is_terminal | מוֹתֵחַ | bool | ||
צעדים/תצפית | מוֹתֵחַ | (376,) | לצוף32 | |
צעדים/פרס | מוֹתֵחַ | לצוף32 |
- דוגמאות ( tfds.as_dataframe ):