- Descriptif :
RL Unplugged est une suite de références pour l'apprentissage par renforcement hors ligne. Le RL Unplugged est conçu autour des considérations suivantes : pour faciliter l'utilisation, nous fournissons les ensembles de données avec une API unifiée qui permet au praticien de travailler facilement avec toutes les données de la suite une fois qu'un pipeline général a été établi.
Les ensembles de données suivent le format RLDS pour représenter les étapes et les épisodes.
Les exemples dans l'ensemble de données représentent les transitions SAR stockées lors de l'exécution d'un agent formé partiellement en ligne, comme décrit dans https://arxiv.org/abs/1904.12901 Nous suivons le format d'ensemble de données RLDS, comme spécifié dans https://github.com/google-research /rlds#format-ensemble-de-données
Nous publions 40 ensembles de données sur 8 tâches au total - sans défi combiné et défi combiné facile sur les tâches cartpole, marcheur, quadrupède et humanoïde. Chaque tâche contient 5 tailles différentes d'ensembles de données, 1 %, 5 %, 20 %, 40 % et 100 %. Notez qu'il n'est pas garanti que le plus petit ensemble de données soit un sous-ensemble des plus grands. Pour plus de détails sur la façon dont l'ensemble de données a été généré, veuillez vous reporter à l'article.
Page d' accueil : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Code source :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
Versions :
-
1.0.0
: Version initiale. -
1.0.1
(par défaut) : corrige un bogue dans l'ensemble de données RLU RWRL où il y a des identifiants d'épisode en double dans l'un des ensembles de données humanoïdes.
-
Taille du téléchargement :
Unknown size
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuration par défaut)
Taille du jeu de données :
172.43 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
Taille du jeu de données :
862.13 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 25 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
Taille du jeu de données :
3.37 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 100 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
Taille du jeu de données :
6.74 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
Taille du jeu de données :
16.84 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
Taille du jeu de données :
1.77 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
Taille du jeu de données :
8.86 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 25 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
Taille du jeu de données :
35.46 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 100 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
Taille du jeu de données :
70.92 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
Taille du jeu de données :
177.29 MiB
Mise en cache automatique ( documentation ) : uniquement lorsque
shuffle_files=False
(train)Fractionnements :
Diviser | Exemples |
---|---|
'train' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
Taille du jeu de données :
6.27 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 50 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
Taille du jeu de données :
31.34 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 250 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
Taille du jeu de données :
125.37 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
Taille du jeu de données :
250.75 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 2 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
Taille du jeu de données :
626.86 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
Taille du jeu de données :
69.40 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
Taille du jeu de données :
346.98 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
Taille du jeu de données :
1.36 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 4 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
Taille du jeu de données :
2.71 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 8 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
Taille du jeu de données :
6.78 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 20 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
Taille du jeu de données :
369.84 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
Taille du jeu de données :
1.81 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 25 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
Taille du jeu de données :
7.22 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 100 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
Taille du jeu de données :
14.45 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
Taille du jeu de données :
36.12 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (1,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/position | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (2,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
Taille du jeu de données :
1.97 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
Taille du jeu de données :
9.83 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 25 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
Taille du jeu de données :
39.31 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 100 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
Taille du jeu de données :
78.63 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
Taille du jeu de données :
196.57 MiB
Mise en cache automatique ( documentation ) : uniquement lorsque
shuffle_files=False
(train)Fractionnements :
Diviser | Exemples |
---|---|
'train' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (12,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
étapes/observation/état_égocentrique | Tenseur | (44,) | float32 | |
étapes/observation/force_torque | Tenseur | (24,) | float32 | |
pas/observation/imu | Tenseur | (6,) | float32 | |
pas/observation/torse_debout | Tenseur | (1,) | float32 | |
pas/observation/torse_velocity | Tenseur | (3,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
Taille du jeu de données :
8.20 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 50 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
Taille du jeu de données :
40.98 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 250 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
Taille du jeu de données :
163.93 MiB
Mise en cache automatique ( documentation ) : uniquement lorsque
shuffle_files=False
(train)Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
Taille du jeu de données :
327.86 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 2 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
Taille du jeu de données :
819.65 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (6,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
marches/observation/hauteur | Tenseur | (1,) | float32 | |
étapes/observation/orientations | Tenseur | (14,) | float32 | |
pas/observation/vitesse | Tenseur | (9,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
Taille du jeu de données :
77.11 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 200 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
Taille du jeu de données :
385.54 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
Taille du jeu de données :
1.51 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 4 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
Taille du jeu de données :
3.01 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 8 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/actions | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
Taille du jeu de données :
7.53 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 20 000 |
- Structure des fonctionnalités :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
retour_épisode | Tenseur | float32 | ||
pas | Base de données | |||
étapes/action | Tenseur | (21,) | float32 | |
étapes/réduction | Tenseur | (1,) | float32 | |
étapes/is_first | Tenseur | bourdonner | ||
pas/est_dernier | Tenseur | bourdonner | ||
étapes/is_terminal | Tenseur | bourdonner | ||
étapes/observation | FonctionnalitésDict | |||
pas/observation/com_velocity | Tenseur | (3,) | float32 | |
pas/observation/mannequin-0 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-1 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-2 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-3 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-4 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-5 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-6 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-7 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-8 | Tenseur | (1,) | float32 | |
étapes/observation/mannequin-9 | Tenseur | (1,) | float32 | |
pas/observation/extrémités | Tenseur | (12,) | float32 | |
pas/observation/head_height | Tenseur | (1,) | float32 | |
étapes/observation/joint_angles | Tenseur | (21,) | float32 | |
pas/observation/torse_vertical | Tenseur | (3,) | float32 | |
pas/observation/vitesse | Tenseur | (27,) | float32 | |
pas/récompense | Tenseur | (1,) | float32 |
- Exemples ( tfds.as_dataframe ):