d4rl_antmaze

  • বর্ণনা :

D4RL অফলাইন রিইনফোর্সমেন্ট শেখার জন্য একটি ওপেন সোর্স বেঞ্চমার্ক। এটি প্রশিক্ষণ এবং বেঞ্চমার্কিং অ্যালগরিদমের জন্য মানসম্মত পরিবেশ এবং ডেটাসেট সরবরাহ করে।

ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (8,) float32
পদক্ষেপ/ছাড় টেনসর float32
পদক্ষেপ/তথ্য ফিচারসডিক্ট
পদক্ষেপ/তথ্য/লক্ষ্য টেনসর (2,) float32
পদক্ষেপ/তথ্য/qpos টেনসর (15,) float32
পদক্ষেপ/infos/qvel টেনসর (14,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ টেনসর (২৯,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (ডিফল্ট কনফিগারেশন)

  • ডাউনলোড সাইজ : 221.76 MiB

  • ডেটাসেটের আকার : 274.83 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 10,154

d4rl_antmaze/umaze-diverse-v0

  • ডাউনলোড সাইজ : 220.16 MiB

  • ডেটাসেটের আকার : 270.23 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,154

d4rl_antmaze/medium-play-v0

  • ডাউনলোডের আকার : 220.40 MiB

  • ডেটাসেটের আকার : 275.20 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 10,695

d4rl_antmaze/medium-diverse-v0

  • ডাউনলোড সাইজ : 220.39 MiB

  • ডেটাসেটের আকার : 271.18 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,924

d4rl_antmaze/large-diverse-v0

  • ডাউনলোড সাইজঃ 220.47 MiB

  • ডেটাসেটের আকার : 273.36 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 7,141

d4rl_antmaze/large-play-v0

  • ডাউনলোড সাইজ : 220.19 MiB

  • ডেটাসেটের আকার : 276.61 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 13,458

d4rl_antmaze/umaze-v2

  • ডাউনলোড সাইজ : 221.76 MiB

  • ডেটাসেটের আকার : 274.83 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 10,154

d4rl_antmaze/umaze-diverse-v2

  • ডাউনলোড সাইজ : 220.16 MiB

  • ডেটাসেটের আকার : 270.20 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,036

d4rl_antmaze/medium-play-v2

  • ডাউনলোডের আকার : 220.40 MiB

  • ডেটাসেটের আকার : 275.22 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 10,768

d4rl_antmaze/মাঝারি-বিচিত্র-v2

  • ডাউনলোড সাইজ : 220.39 MiB

  • ডেটাসেটের আকার : 271.19 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,959

d4rl_antmaze/large-diverse-v2

  • ডাউনলোড সাইজঃ 220.47 MiB

  • ডেটাসেটের আকার : 273.38 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 7,189

d4rl_antmaze/large-play-v2

  • ডাউনলোড সাইজঃ 220.18 MiB

  • ডেটাসেটের আকার : 276.63 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 13,517