- Mô tả :
RL Unplugged là bộ tiêu chuẩn cho việc học tăng cường ngoại tuyến. RL Unplugged được thiết kế dựa trên những cân nhắc sau: để tạo điều kiện thuận lợi cho việc sử dụng, chúng tôi cung cấp các bộ dữ liệu với một API thống nhất giúp người thực hành dễ dàng làm việc với tất cả dữ liệu trong bộ sau khi một quy trình chung đã được thiết lập.
Các bộ dữ liệu tuân theo định dạng RLDS để thể hiện các bước và giai đoạn.
Các ví dụ trong tập dữ liệu thể hiện các chuyển đổi SAR được lưu trữ khi chạy tác nhân được đào tạo một phần trực tuyến như được mô tả trong https://arxiv.org/abs/1904.12901 Chúng tôi tuân theo định dạng tập dữ liệu RLDS, như được chỉ định trong https://github.com/google-research /rlds#dataset-format
Chúng tôi phát hành tổng cộng 40 bộ dữ liệu cho 8 nhiệm vụ -- không có thử thách kết hợp và thử thách kết hợp dễ dàng đối với các nhiệm vụ xe đẩy, xe tập đi, bốn chân và hình người. Mỗi tác vụ chứa 5 kích cỡ khác nhau của bộ dữ liệu, 1%, 5%, 20%, 40% và 100%. Lưu ý rằng tập dữ liệu nhỏ hơn không được đảm bảo là tập con của tập dữ liệu lớn hơn. Để biết chi tiết về cách tạo bộ dữ liệu, vui lòng tham khảo bài viết.
Trang chủ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Mã nguồn :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
1.0.1
(mặc định): Sửa lỗi trong bộ dữ liệu RLU RWRL trong đó có id tập trùng lặp trong một trong các bộ dữ liệu hình người.
-
Kích thước tải xuống :
Unknown size
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (cấu hình mặc định)
Kích thước tập dữ liệu :
172.43 KiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
Kích thước tập dữ liệu :
862.13 KiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 25 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
Kích thước tập dữ liệu :
3.37 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 100 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
Kích thước tập dữ liệu :
6.74 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
Kích thước tập dữ liệu :
16.84 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
Kích thước tập dữ liệu :
1.77 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
Kích thước tập dữ liệu :
8.86 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 25 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
Kích thước tập dữ liệu :
35.46 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 100 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
Kích thước tập dữ liệu :
70.92 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
Kích thước tập dữ liệu :
177.29 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi
shuffle_files=False
(đào tạo)Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
Kích thước tập dữ liệu :
6.27 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 50 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
Kích thước tập dữ liệu :
31.34 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 250 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
Kích thước tập dữ liệu :
125.37 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
Kích thước tập dữ liệu :
250.75 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 2.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
Kích thước tập dữ liệu :
626.86 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
Kích thước tập dữ liệu :
69.40 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
Kích thước tập dữ liệu :
346.98 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
Kích thước tập dữ liệu :
1.36 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 4.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
Kích thước tập dữ liệu :
2.71 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 8.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
Kích thước tập dữ liệu :
6.78 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 20.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
Kích thước tập dữ liệu :
369.84 KiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
Kích thước tập dữ liệu :
1.81 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 25 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
Kích thước tập dữ liệu :
7.22 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 100 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
Kích thước tập dữ liệu :
14.45 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
Kích thước tập dữ liệu :
36.12 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (1,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/vị trí | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (2,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
Kích thước tập dữ liệu :
1.97 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
Kích thước tập dữ liệu :
9.83 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 25 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
Kích thước tập dữ liệu :
39.31 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 100 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
Kích thước tập dữ liệu :
78.63 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
Kích thước tập dữ liệu :
196.57 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi
shuffle_files=False
(đào tạo)Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (12,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/egocentric_state | tenxơ | (44,) | phao32 | |
các bước/quan sát/force_torque | tenxơ | (24,) | phao32 | |
các bước/quan sát/imu | tenxơ | (6,) | phao32 | |
bước/quan sát/torso_upright | tenxơ | (1,) | phao32 | |
bước/quan sát/torso_velocity | tenxơ | (3,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
Kích thước tập dữ liệu :
8.20 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 50 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
Kích thước tập dữ liệu :
40.98 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 250 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
Kích thước tập dữ liệu :
163.93 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi
shuffle_files=False
(đào tạo)Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
Kích thước tập dữ liệu :
327.86 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 2.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
Kích thước tập dữ liệu :
819.65 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 5.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (6,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước/quan sát/chiều cao | tenxơ | (1,) | phao32 | |
các bước/quan sát/định hướng | tenxơ | (14,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (9,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
Kích thước tập dữ liệu :
77.11 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 200 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
Kích thước tập dữ liệu :
385.54 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
Kích thước tập dữ liệu :
1.51 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 4.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
Kích thước tập dữ liệu :
3.01 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 8.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
Kích thước tập dữ liệu :
7.53 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 20.000 |
- Cấu trúc tính năng :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tập_return | tenxơ | phao32 | ||
bước | tập dữ liệu | |||
bước/hành động | tenxơ | (21,) | phao32 | |
bước/giảm giá | tenxơ | (1,) | phao32 | |
các bước/is_first | tenxơ | bool | ||
bước/is_last | tenxơ | bool | ||
bước/is_terminal | tenxơ | bool | ||
các bước/quan sát | Tính năngDict | |||
bước/quan sát/com_velocity | tenxơ | (3,) | phao32 | |
các bước/quan sát/dummy-0 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-1 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-2 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-3 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-4 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-5 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-6 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-7 | tenxơ | (1,) | phao32 | |
bước/quan sát/dummy-8 | tenxơ | (1,) | phao32 | |
các bước/quan sát/dummy-9 | tenxơ | (1,) | phao32 | |
bước / quan sát / chi | tenxơ | (12,) | phao32 | |
bước/quan sát/head_height | tenxơ | (1,) | phao32 | |
bước/quan sát/joint_angles | tenxơ | (21,) | phao32 | |
bước/quan sát/torso_vertical | tenxơ | (3,) | phao32 | |
bước/quan sát/vận tốc | tenxơ | (27,) | phao32 | |
bước/phần thưởng | tenxơ | (1,) | phao32 |
- Ví dụ ( tfds.as_dataframe ):