cmu_franka_exploration_dataset_converted_externally_to_rlds

  • Sự miêu tả :

Franka khám phá đồ chơi nhà bếp

Tách ra Ví dụ
'train' 199
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'highres_image': Image(shape=(480, 640, 3), dtype=uint8),
            'image': Image(shape=(64, 64, 3), dtype=uint8),
        }),
        'reward': Scalar(shape=(), dtype=float32),
        'structured_action': Tensor(shape=(8,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tập_siêu dữ liệu Tính năngDict
tập_siêu dữ liệu/file_path Chữ sợi dây Đường dẫn tới file dữ liệu gốc.
bước Tập dữ liệu
bước/hành động Tenxơ (số 8,) phao32 Hành động của robot, bao gồm [vị trí tác động cuối3x, định hướng tác động cuối3x, hành động kẹp1x, chấm dứt tập1x].
bước/giảm giá Vô hướng phao32 Giảm giá nếu được cung cấp, mặc định là 1.
bước/is_first Tenxơ bool
bước/is_last Tenxơ bool
bước/is_terminal Tenxơ bool
các bước/ngôn ngữ_embedding Tenxơ (512,) phao32 Nhúng ngôn ngữ Kona. Xem https://tfhub.dev/google/universal-sentence-encoding-large/5
các bước/ngôn ngữ_instruction Chữ sợi dây Giảng dạy ngôn ngữ.
bước/quan sát Tính năngDict
bước/quan sát/highres_image Hình ảnh (480, 640, 3) uint8 Quan sát camera chính có độ phân giải cao
bước/quan sát/hình ảnh Hình ảnh (64, 64, 3) uint8 Quan sát RGB của camera chính.
bước/phần thưởng Vô hướng phao32 Phần thưởng nếu được cung cấp, 1 ở bước cuối cùng cho bản demo.
bước/cấu trúc_action Tenxơ (số 8,) phao32 Hành động có cấu trúc, bao gồm khả năng chi trả kết hợp và kiểm soát tác nhân cuối, được mô tả trong Mô hình thế giới có cấu trúc từ Video của con người.
  • Trích dẫn :
@inproceedings{mendonca2023structured,
              title={Structured World Models from Human Videos},
              author={Mendonca, Russell  and Bahl, Shikhar and Pathak, Deepak},
              journal={RSS},
              year={2023}
            }