গতিবিধি

  • বর্ণনা :

MuJoCo লোকোমোশন টাস্কের পরিবেশ পুরস্কারের উপর প্রশিক্ষণপ্রাপ্ত একটি SAC এজেন্ট দিয়ে ডেটাসেট তৈরি করা হয়েছে। এই ডেটাসেটগুলি প্রতিপক্ষের অনুকরণ শেখার জন্য কী বিষয়গুলিতে ব্যবহৃত হয়? ওরসিনি এট আল। 2021

ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS ফর্ম্যাট অনুসরণ করে

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : পিঁপড়ার জন্য 1M ধাপের জন্য প্রশিক্ষিত একটি SAC এজেন্ট দ্বারা তৈরি ডেটাসেট।

  • ডাউনলোড সাইজ : 6.49 MiB

  • ডেটাসেটের আকার : 23.02 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (8,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (111,) float32
পদক্ষেপ/পুরস্কার টেনসর float32

locomotion/hopper_sac_1M_single_policy_stochastic

  • কনফিগারেশনের বিবরণ : হপারের জন্য 1M ধাপের জন্য প্রশিক্ষিত একটি SAC এজেন্ট দ্বারা উত্পন্ন ডেটাসেট।

  • ডাউনলোড সাইজ : 2.26 MiB

  • ডেটাসেটের আকার : 2.62 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (৩,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (১১,) float32
পদক্ষেপ/পুরস্কার টেনসর float32

locomotion/halfcheetah_sac_1M_single_policy_stochastic

  • কনফিগারেশনের বিবরণ : হাফচিতা-এর জন্য 1M ধাপের জন্য প্রশিক্ষিত একটি SAC এজেন্ট দ্বারা তৈরি ডেটাসেট।

  • ডাউনলোড সাইজ : 4.49 MiB

  • ডেটাসেটের আকার : 4.93 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (17,) float32
পদক্ষেপ/পুরস্কার টেনসর float32

locomotion/walker2d_sac_1M_single_policy_stochastic

  • কনফিগারেশনের বিবরণ : Walker2d-এর জন্য 1M ধাপের জন্য প্রশিক্ষণপ্রাপ্ত SAC এজেন্ট দ্বারা তৈরি ডেটাসেট।

  • ডাউনলোড সাইজঃ 4.35 MiB

  • ডেটাসেটের আকার : 4.91 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (17,) float32
পদক্ষেপ/পুরস্কার টেনসর float32

locomotion/humanoid_sac_15M_single_policy_stochastic

  • কনফিগারেশনের বিবরণ : হিউম্যানয়েডের জন্য 15M ধাপের জন্য প্রশিক্ষণপ্রাপ্ত একটি SAC এজেন্ট দ্বারা উত্পন্ন ডেটাসেট।

  • ডাউনলোড সাইজ : 192.78 MiB

  • ডেটাসেটের আকার : 300.94 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (17,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (376,) float32
পদক্ষেপ/পুরস্কার টেনসর float32