תְנוּעָה

  • תיאור :

מערכי הנתונים נוצרו עם סוכן SAC שהוכשר על תגמול הסביבה של משימות תנועה של MuJoCo. מערכי נתונים אלה משמשים ב- What Matters for Adversarial Imitation Learning? אורסיני וחב'. 2021 .

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (תצורת ברירת המחדל)

  • תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Ant.

  • גודל הורדה : 6.49 MiB

  • גודל ערכת נתונים : 23.02 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (8,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (111,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32

locomotion/hopper_sac_1M_single_policy_stochastic

  • תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Hopper.

  • גודל הורדה : 2.26 MiB

  • גודל ערכת נתונים : 2.62 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (3,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (11,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32

locomotion/halfcheetah_sac_1M_single_policy_stochastic

  • תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור HalfChetah.

  • גודל הורדה : 4.49 MiB

  • גודל ערכת נתונים : 4.93 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (17,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32

locomotion/walker2d_sac_1M_single_policy_stochastic

  • תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Walker2d.

  • גודל הורדה : 4.35 MiB

  • גודל ערכת נתונים : 4.91 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (17,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32

locomotion/humanoid_sac_15M_single_policy_stochastic

  • תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-15 מיליון שלבים עבור Humanoid.

  • גודל הורדה : 192.78 MiB

  • גודל מערך נתונים : 300.94 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (17,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (376,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32