rlu_rwrl

  • Mô tả :

RL Unplugged là bộ tiêu chuẩn cho việc học củng cố ngoại tuyến. RL Unplugged được thiết kế dựa trên các yếu tố sau: để tạo điều kiện dễ sử dụng, chúng tôi cung cấp bộ dữ liệu với một API thống nhất giúp người hành nghề dễ dàng làm việc với tất cả dữ liệu trong bộ sau khi quy trình chung đã được thiết lập.

Bộ dữ liệu tuân theo định dạng RLDS để biểu thị các bước và các tập.

Các ví dụ trong tập dữ liệu thể hiện các chuyển đổi SAR được lưu trữ khi chạy một tác nhân được đào tạo trực tuyến một phần như được mô tả trong https://arxiv.org/abs/1904.12901 Chúng tôi tuân theo định dạng tập dữ liệu RLDS, như được chỉ định trong https://github.com/google-research / rlds # dataset-format

Chúng tôi phát hành tổng cộng 40 bộ dữ liệu cho 8 nhiệm vụ - không có thử thách kết hợp nào và thử thách kết hợp dễ dàng đối với các nhiệm vụ hình người, người đi bộ, máy bay bốn chân và hình người. Mỗi tác vụ chứa 5 kích thước khác nhau của tập dữ liệu, 1%, 5%, 20%, 40% và 100%. Lưu ý rằng tập dữ liệu nhỏ hơn không được đảm bảo là một tập con của những tập dữ liệu lớn hơn. Để biết chi tiết về cách tạo tập dữ liệu, vui lòng tham khảo bài báo.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl / cartpole_swingup_combined_challenge_none_1_percent (cấu hình mặc định)

  • Kích thước tập dữ liệu: 172.43 KiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu: 862.13 KiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 3.37 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 6.74 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 16.84 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu : 1.77 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 8.86 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu: 35.46 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu: 70.92 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu: 177.29 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (huấn luyện)

  • Tách :

Tách ra Các ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu : 6.27 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 50
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 31.34 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 250
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu: 125.37 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu: 250.75 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 2.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu: 626.86 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 5.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / humanoid_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu: 69.40 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (21,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / com_velocity Tensor (3,) tf.float32
bước / quan sát / chi Tensor (12,) tf.float32
bước / quan sát / head_height Tensor (1,) tf.float32
bước / quan sát / doanh_số Tensor (21,) tf.float32
bước / quan sát / torso_vertical Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (27,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / humanoid_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu: 346.98 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (21,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / com_velocity Tensor (3,) tf.float32
bước / quan sát / chi Tensor (12,) tf.float32
bước / quan sát / head_height Tensor (1,) tf.float32
bước / quan sát / doanh_số Tensor (21,) tf.float32
bước / quan sát / torso_vertical Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (27,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / humanoid_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 1.36 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 4.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (21,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / com_velocity Tensor (3,) tf.float32
bước / quan sát / chi Tensor (12,) tf.float32
bước / quan sát / head_height Tensor (1,) tf.float32
bước / quan sát / doanh_số Tensor (21,) tf.float32
bước / quan sát / torso_vertical Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (27,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / humanoid_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 2.71 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 8.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (21,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / com_velocity Tensor (3,) tf.float32
bước / quan sát / chi Tensor (12,) tf.float32
bước / quan sát / head_height Tensor (1,) tf.float32
bước / quan sát / doanh_số Tensor (21,) tf.float32
bước / quan sát / torso_vertical Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (27,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / humanoid_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 6.78 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 20.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (21,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / com_velocity Tensor (3,) tf.float32
bước / quan sát / chi Tensor (12,) tf.float32
bước / quan sát / head_height Tensor (1,) tf.float32
bước / quan sát / doanh_số Tensor (21,) tf.float32
bước / quan sát / torso_vertical Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (27,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu: 369.84 KiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 1.81 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu : 7.22 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu : 14.45 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / cartpole_swingup_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu : 36.12 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (1,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / vị trí Tensor (3,) tf.float32
bước / quan sát / vận tốc Tensor (2,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 1.97 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 9.83 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu: 39.31 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu: 78.63 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / quadruped_walk_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu: 196.57 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (huấn luyện)

  • Tách :

Tách ra Các ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (12,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / egocentric_state Tensor (44,) tf.float32
bước / quan sát / force_torque Tensor (24,) tf.float32
bước / quan sát / imu Tensor (6,) tf.float32
bước / quan sát / torso_upright Tensor (1,) tf.float32
bước / quan sát / torso_velocity Tensor (3,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 8.20 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 50
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu: 40.98 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 250
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu: 163.93 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (huấn luyện)

  • Tách :

Tách ra Các ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
các bước / quan sát Các tính năng
bước / quan sát / dummy-0 Tensor (1,) tf.float32
bước / quan sát / dummy-1 Tensor (1,) tf.float32
bước / quan sát / dummy-2 Tensor (1,) tf.float32
bước / quan sát / dummy-3 Tensor (1,) tf.float32
bước / quan sát / dummy-4 Tensor (1,) tf.float32
bước / quan sát / dummy-5 Tensor (1,) tf.float32
bước / quan sát / dummy-6 Tensor (1,) tf.float32
bước / quan sát / dummy-7 Tensor (1,) tf.float32
bước / quan sát / dummy-8 Tensor (1,) tf.float32
bước / quan sát / dummy-9 Tensor (1,) tf.float32
bước / quan sát / chiều cao Tensor (1,) tf.float32
bước / quan sát / định hướng Tensor (14,) tf.float32
bước / quan sát / vận tốc Tensor (9,) tf.float32
bước / phần thưởng Tensor (1,) tf.float32

rlu_rwrl / walker_walk_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu: 327.86 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 2.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
Episode_return Tensor tf.float32
các bước Dataset
các bước / hành động Tensor (6,) tf.float32
bước / chiết khấu Tensor (1,) tf.float32
bước / is_first Tensor tf.bool
bước / is_last Tensor tf.bool
step / is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Dataset size : 819.65 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 5,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (6,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Dataset size : 77.11 MiB

  • Auto-cached ( documentation ): Yes

  • Splits :

Split Examples
'train' 200
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Dataset size : 385.54 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 1,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Dataset size : 1.51 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 4,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Dataset size : 3.01 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 8,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Dataset size : 7.53 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 20,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32