- বর্ণনা :
D4RL অফলাইন রিইনফোর্সমেন্ট শেখার জন্য একটি ওপেন সোর্স বেঞ্চমার্ক। এটি প্রশিক্ষণ এবং বেঞ্চমার্কিং অ্যালগরিদমের জন্য মানসম্মত পরিবেশ এবং ডেটাসেট সরবরাহ করে।
ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।
কনফিগারের বিবরণ : https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze- এ টাস্ক এবং এর সংস্করণ সম্পর্কে আরও বিশদ দেখুন
উত্স কোড :
tfds.d4rl.d4rl_antmaze.D4rlAntmaze
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
1.1.1
(ডিফল্ট): v2 ডেটাসেট যোগ করা হয়েছে।
-
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বৈশিষ্ট্য গঠন :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'goal': Tensor(shape=(2,), dtype=float32),
'qpos': Tensor(shape=(15,), dtype=float32),
'qvel': Tensor(shape=(14,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(29,), dtype=float32),
'reward': float32,
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (8,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
পদক্ষেপ/তথ্য | ফিচারসডিক্ট | |||
পদক্ষেপ/তথ্য/লক্ষ্য | টেনসর | (2,) | float32 | |
পদক্ষেপ/তথ্য/qpos | টেনসর | (15,) | float32 | |
পদক্ষেপ/infos/qvel | টেনসর | (14,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | টেনসর | (২৯,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@misc{fu2020d4rl,
title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
year={2020},
eprint={2004.07219},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
d4rl_antmaze/umaze-v0 (ডিফল্ট কনফিগারেশন)
ডাউনলোড সাইজ :
221.76 MiB
ডেটাসেটের আকার :
274.83 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10,154 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-diverse-v0
ডাউনলোড সাইজ :
220.16 MiB
ডেটাসেটের আকার :
270.23 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,154 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/medium-play-v0
ডাউনলোডের আকার :
220.40 MiB
ডেটাসেটের আকার :
275.20 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10,695 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/medium-diverse-v0
ডাউনলোড সাইজ :
220.39 MiB
ডেটাসেটের আকার :
271.18 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,924 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/large-diverse-v0
ডাউনলোড সাইজঃ
220.47 MiB
ডেটাসেটের আকার :
273.36 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 7,141 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/large-play-v0
ডাউনলোড সাইজ :
220.19 MiB
ডেটাসেটের আকার :
276.61 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 13,458 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-v2
ডাউনলোড সাইজ :
221.76 MiB
ডেটাসেটের আকার :
274.83 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10,154 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-diverse-v2
ডাউনলোড সাইজ :
220.16 MiB
ডেটাসেটের আকার :
270.20 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,036 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/medium-play-v2
ডাউনলোডের আকার :
220.40 MiB
ডেটাসেটের আকার :
275.22 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10,768 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/মাঝারি-বিচিত্র-v2
ডাউনলোড সাইজ :
220.39 MiB
ডেটাসেটের আকার :
271.19 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,959 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/large-diverse-v2
ডাউনলোড সাইজঃ
220.47 MiB
ডেটাসেটের আকার :
273.38 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 7,189 |
- উদাহরণ ( tfds.as_dataframe ):
d4rl_antmaze/large-play-v2
ডাউনলোড সাইজঃ
220.18 MiB
ডেটাসেটের আকার :
276.63 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 13,517 |
- উদাহরণ ( tfds.as_dataframe ):