- Opis :
Te zbiory danych zostały utworzone w środowisku PickPlaceCan symulatora ramienia robota robosuite . Zbiory danych ludzkich zostały zarejestrowane przez jednego operatora przy użyciu kreatora RLDS i kontrolera gamepada.
Syntetyczne zbiory danych zostały zarejestrowane przy użyciu biblioteki EnvLogger .
Zbiory danych są zgodne z formatem RLDS i reprezentują kroki i odcinki.
Odcinki składają się z 400 kroków. W każdym odcinku po ukończeniu zadania dodawany jest tag, który jest przechowywany jako część metadanych kroku niestandardowego.
Należy pamiętać, że ze względu na zależność EnvLogger generowanie tego zestawu danych jest obecnie obsługiwane tylko w środowiskach Linux.
Kod źródłowy :
tfds.rlds.datasets.robosuite_panda_pick_place_can.RobosuitePandaPickPlaceCan
Wersje :
-
1.0.0
(domyślnie): Wersja pierwsza.
-
Automatyczne buforowanie ( dokumentacja ): Nie
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{ramos2021rlds,
title={RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning},
author={Sabela Ramos and Sertan Girgin and Léonard Hussenot and Damien Vincent and Hanna Yakubovich and Daniel Toyama and Anita Gergely and Piotr Stanczyk and Raphael Marinier and Jeremiah Harmsen and Olivier Pietquin and Nikola Momchev},
year={2021},
eprint={2111.02767},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
robosuite_panda_pick_place_can/human_dc29b40a (konfiguracja domyślna)
Opis konfiguracji : zbiór danych wygenerowany przez człowieka (50 odcinków).
Strona główna : https://github.com/google-research/rlds
Rozmiar pobierania :
96.67 MiB
Rozmiar zbioru danych :
407.24 MiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float64),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float64),
'Can_quat': Tensor(shape=(4,), dtype=float64),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'object-state': Tensor(shape=(14,), dtype=float64),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/akcja | Napinacz | (7,) | pływak64 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/is_terminal | Napinacz | bool | ||
kroki/obserwacje | FunkcjeDykt | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/stan-obiektu | Napinacz | (14,) | pływak64 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak64 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/tag:umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):
robosuite_panda_pick_place_can/human_images_dc29b40a
Opis konfiguracji : Zbiór danych wygenerowany przez człowieka, obejmujący obrazy wykonane z różnych kątów kamery podczas obserwacji. Pamiętaj, że wygenerowanie może zająć trochę czasu.
Strona główna : https://www.tensorflow.org/datasets/catalog/robosuite_panda_pick_place_can
Rozmiar pobierania :
10.95 GiB
Rozmiar zbioru danych :
7.53 GiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float64),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float64),
'Can_quat': Tensor(shape=(4,), dtype=float64),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'agentview_image': Image(shape=(256, 256, 3), dtype=uint8),
'birdview_image': Image(shape=(256, 256, 3), dtype=uint8),
'object-state': Tensor(shape=(14,), dtype=float64),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
'robot0_eye_in_hand_image': Image(shape=(256, 256, 3), dtype=uint8),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
'robot0_robotview_image': Image(shape=(256, 256, 3), dtype=uint8),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/akcja | Napinacz | (7,) | pływak64 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/is_terminal | Napinacz | bool | ||
kroki/obserwacje | FunkcjeDykt | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/obraz_agentview | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/obraz_ptaka | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/stan-obiektu | Napinacz | (14,) | pływak64 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/obraz0_oko_robota_w_ręce_robota | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak64 | |
kroki/obserwacja/robot0_robotview_image | Obraz | (256, 256, 3) | uint8 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/tag:umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):
robosuite_panda_pick_place_can/synthetic_stochastic_sac_afe13968
Opis konfiguracji : Syntetyczny zestaw danych wygenerowany przez agenta stochastycznego przeszkolonego za pomocą SAC (200 odcinków).
Strona główna : https://github.com/google-research/rlds
Rozmiar pobierania :
144.44 MiB
Rozmiar zbioru danych :
622.86 MiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float32),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float32),
'Can_quat': Tensor(shape=(4,), dtype=float32),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'object-state': Tensor(shape=(14,), dtype=float32),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float32),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float32),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float32),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float32),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float32),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float32),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/akcja | Napinacz | (7,) | pływak32 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/is_terminal | Napinacz | bool | ||
kroki/obserwacje | FunkcjeDykt | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/stan-obiektu | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak32 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak32 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak32 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/tag:umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):