robosuite_panda_pick_place_can

  • Opis :

Te zbiory danych zostały utworzone w środowisku PickPlaceCan symulatora ramienia robota robosuite . Zbiory danych ludzkich zostały zarejestrowane przez jednego operatora przy użyciu kreatora RLDS i kontrolera gamepada.

Syntetyczne zbiory danych zostały zarejestrowane przy użyciu biblioteki EnvLogger .

Zbiory danych są zgodne z formatem RLDS i reprezentują kroki i odcinki.

Odcinki składają się z 400 kroków. W każdym odcinku po ukończeniu zadania dodawany jest tag, który jest przechowywany jako część metadanych kroku niestandardowego.

Należy pamiętać, że ze względu na zależność EnvLogger generowanie tego zestawu danych jest obecnie obsługiwane tylko w środowiskach Linux.

@misc{ramos2021rlds,
      title={RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning},
      author={Sabela Ramos and Sertan Girgin and Léonard Hussenot and Damien Vincent and Hanna Yakubovich and Daniel Toyama and Anita Gergely and Piotr Stanczyk and Raphael Marinier and Jeremiah Harmsen and Olivier Pietquin and Nikola Momchev},
      year={2021},
      eprint={2111.02767},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

robosuite_panda_pick_place_can/human_dc29b40a (konfiguracja domyślna)

  • Opis konfiguracji : zbiór danych wygenerowany przez człowieka (50 odcinków).

  • Strona główna : https://github.com/google-research/rlds

  • Rozmiar pobierania : 96.67 MiB

  • Rozmiar zbioru danych : 407.24 MiB

  • Podziały :

Podział Przykłady
'train' 50
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float64),
            'Can_quat': Tensor(shape=(4,), dtype=float64),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'object-state': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
identyfikator_agenta Napinacz strunowy
identyfikator odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/akcja Napinacz (7,) pływak64
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/is_terminal Napinacz bool
kroki/obserwacje FunkcjeDykt
kroki/obserwacja/Can_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_quat Napinacz (4,) pływak64
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/stan-obiektu Napinacz (14,) pływak64
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak64
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak64
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak64
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak64
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak64
kroki/nagroda Napinacz pływak64
kroki/tag:umieszczone Napinacz bool

robosuite_panda_pick_place_can/human_images_dc29b40a

Podział Przykłady
'train' 50
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float64),
            'Can_quat': Tensor(shape=(4,), dtype=float64),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'agentview_image': Image(shape=(256, 256, 3), dtype=uint8),
            'birdview_image': Image(shape=(256, 256, 3), dtype=uint8),
            'object-state': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(256, 256, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
            'robot0_robotview_image': Image(shape=(256, 256, 3), dtype=uint8),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
identyfikator_agenta Napinacz strunowy
identyfikator odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/akcja Napinacz (7,) pływak64
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/is_terminal Napinacz bool
kroki/obserwacje FunkcjeDykt
kroki/obserwacja/Can_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_quat Napinacz (4,) pływak64
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/obraz_agentview Obraz (256, 256, 3) uint8
kroki/obserwacja/obraz_ptaka Obraz (256, 256, 3) uint8
kroki/obserwacja/stan-obiektu Napinacz (14,) pływak64
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak64
kroki/obserwacja/obraz0_oko_robota_w_ręce_robota Obraz (256, 256, 3) uint8
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak64
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak64
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak64
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak64
kroki/obserwacja/robot0_robotview_image Obraz (256, 256, 3) uint8
kroki/nagroda Napinacz pływak64
kroki/tag:umieszczone Napinacz bool

robosuite_panda_pick_place_can/synthetic_stochastic_sac_afe13968

  • Opis konfiguracji : Syntetyczny zestaw danych wygenerowany przez agenta stochastycznego przeszkolonego za pomocą SAC (200 odcinków).

  • Strona główna : https://github.com/google-research/rlds

  • Rozmiar pobierania : 144.44 MiB

  • Rozmiar zbioru danych : 622.86 MiB

  • Podziały :

Podział Przykłady
'train' 200
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float32),
            'Can_quat': Tensor(shape=(4,), dtype=float32),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'object-state': Tensor(shape=(14,), dtype=float32),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float32),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float32),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float32),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float32),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float32),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float32),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
identyfikator_agenta Napinacz strunowy
identyfikator odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/akcja Napinacz (7,) pływak32
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/is_terminal Napinacz bool
kroki/obserwacje FunkcjeDykt
kroki/obserwacja/Can_pos Napinacz (3,) pływak32
kroki/obserwacja/Can_quat Napinacz (4,) pływak32
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak32
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/stan-obiektu Napinacz (14,) pływak32
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak32
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak32
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak32
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak32
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak32
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak32
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak32
kroki/nagroda Napinacz pływak64
kroki/tag:umieszczone Napinacz bool