utokyo_saytap_converted_externally_to_rlds
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
A1 ウォーキング、RGB なし
FeaturesDict({
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
}),
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32, description=Robot action, consists of [12x joint positios].),
'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'desired_pattern': Tensor(shape=(4, 5), dtype=bool, description=Desired foot contact pattern for the 4 legs, the 4 rows are for the front right, front left, rear right and rear left legs, the pattern length is 5 (=0.1s).),
'desired_vel': Tensor(shape=(3,), dtype=float32, description=Desired velocites. The first 2 are linear velocities along and perpendicular to the heading direction, the 3rd is the desired angular velocity about the yaw axis.),
'image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy camera RGB observation.),
'prev_act': Tensor(shape=(12,), dtype=float32, description=Actions applied in the previous step.),
'proj_grav_vec': Tensor(shape=(3,), dtype=float32, description=The gravity vector [0, 0, -1] in the robot base frame.),
'state': Tensor(shape=(30,), dtype=float32, description=Robot state, consists of [3x robot base linear velocity, 3x base angular vel, 12x joint position, 12x joint velocity].),
'wrist_image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy wrist camera RGB observation.),
}),
'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
}),
})
特徴 | クラス | 形 | Dタイプ | 説明 |
---|
| 特徴辞書 | | | |
エピソード_メタデータ | 特徴辞書 | | | |
エピソードメタデータ/ファイルパス | 文章 | | 弦 | 元のデータ ファイルへのパス。 |
ステップ | データセット | | | |
ステップ/アクション | テンソル | (12,) | float32 | ロボットアクションは【12×関節位置】で構成されています。 |
歩数/割引 | スカラー | | float32 | 割引が指定されている場合、デフォルトは 1 です。 |
ステップ/is_first | テンソル | | ブール | |
ステップ/is_last | テンソル | | ブール | |
ステップ/is_terminal | テンソル | | ブール | |
ステップ/言語_埋め込み | テンソル | (512,) | float32 | コナ言語の埋め込み。 https://tfhub.dev/google/universal-sentence-encoder-large/5 を参照してください。 |
ステップ/言語説明 | 文章 | | 弦 | 言語指導。 |
ステップ/観察 | 特徴辞書 | | | |
ステップ/観察/望ましいパターン | テンソル | (4、5) | ブール | 4 つの脚に対する望ましい足の接地パターン。4 行は右前脚、左前脚、右後脚、左後脚で、パターンの長さは 5 (=0.1 秒) です。 |
ステップ/観察/desired_vel | テンソル | (3,) | float32 | 望ましいベロサイト。最初の 2 つは進行方向に沿った、および進行方向に垂直な線速度で、3 番目はヨー軸の周りの目標角速度です。 |
手順・観察・イメージ | 画像 | (64、64、3) | uint8 | ダミーカメラRGB観察。 |
ステップ/観察/prev_act | テンソル | (12,) | float32 | 前のステップで適用されたアクション。 |
ステップ/観察/proj_grav_vec | テンソル | (3,) | float32 | ロボットベースフレームの重力ベクトル [0, 0, -1]。 |
ステップ/観察/状態 | テンソル | (30,) | float32 | ロボットの状態は、[3x ロボットベース線速度、3x ベース角速度、12x ジョイント位置、12x ジョイント速度] で構成されます。 |
歩数/観察/手首画像 | 画像 | (64、64、3) | uint8 | ダミーリストカメラRGB観察。 |
歩数/報酬 | スカラー | | float32 | 提供されている場合は報酬、デモの最終ステップで 1。 |
@article{saytap2023,
author = {Yujin Tang and Wenhao Yu and Jie Tan and Heiga Zen and Aleksandra Faust and
Tatsuya Harada},
title = {SayTap: Language to Quadrupedal Locomotion},
eprint = {arXiv:2306.07580},
url = {https://saytap.github.io},
note = "{https://saytap.github.io}",
year = {2023}
}
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-12-17 UTC。
[null,null,["最終更新日 2024-12-17 UTC。"],[],[],null,["# utokyo_saytap_converted_externally_to_rlds\n\n\u003cbr /\u003e\n\n- **Description**:\n\nA1 walking, no RGB\n\n- **Homepage** : \u003chttps://saytap.github.io/\u003e\n\n- **Source code** :\n [`tfds.robotics.rtx.UtokyoSaytapConvertedExternallyToRlds`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/robotics/rtx/rtx.py)\n\n- **Versions**:\n\n - **`0.1.0`** (default): Initial release.\n- **Download size** : `Unknown size`\n\n- **Dataset size** : `55.34 MiB`\n\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n Yes\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'train'` | 20 |\n\n- **Feature structure**:\n\n FeaturesDict({\n 'episode_metadata': FeaturesDict({\n 'file_path': Text(shape=(), dtype=string),\n }),\n 'steps': Dataset({\n 'action': Tensor(shape=(12,), dtype=float32, description=Robot action, consists of [12x joint positios].),\n 'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),\n 'is_first': bool,\n 'is_last': bool,\n 'is_terminal': bool,\n 'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),\n 'language_instruction': Text(shape=(), dtype=string),\n 'observation': FeaturesDict({\n 'desired_pattern': Tensor(shape=(4, 5), dtype=bool, description=Desired foot contact pattern for the 4 legs, the 4 rows are for the front right, front left, rear right and rear left legs, the pattern length is 5 (=0.1s).),\n 'desired_vel': Tensor(shape=(3,), dtype=float32, description=Desired velocites. The first 2 are linear velocities along and perpendicular to the heading direction, the 3rd is the desired angular velocity about the yaw axis.),\n 'image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy camera RGB observation.),\n 'prev_act': Tensor(shape=(12,), dtype=float32, description=Actions applied in the previous step.),\n 'proj_grav_vec': Tensor(shape=(3,), dtype=float32, description=The gravity vector [0, 0, -1] in the robot base frame.),\n 'state': Tensor(shape=(30,), dtype=float32, description=Robot state, consists of [3x robot base linear velocity, 3x base angular vel, 12x joint position, 12x joint velocity].),\n 'wrist_image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy wrist camera RGB observation.),\n }),\n 'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),\n }),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|-----------------------------------|--------------|-------------|---------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| | FeaturesDict | | | |\n| episode_metadata | FeaturesDict | | | |\n| episode_metadata/file_path | Text | | string | Path to the original data file. |\n| steps | Dataset | | | |\n| steps/action | Tensor | (12,) | float32 | Robot action, consists of \\[12x joint positios\\]. |\n| steps/discount | Scalar | | float32 | Discount if provided, default to 1. |\n| steps/is_first | Tensor | | bool | |\n| steps/is_last | Tensor | | bool | |\n| steps/is_terminal | Tensor | | bool | |\n| steps/language_embedding | Tensor | (512,) | float32 | Kona language embedding. See \u003chttps://tfhub.dev/google/universal-sentence-encoder-large/5\u003e |\n| steps/language_instruction | Text | | string | Language Instruction. |\n| steps/observation | FeaturesDict | | | |\n| steps/observation/desired_pattern | Tensor | (4, 5) | bool | Desired foot contact pattern for the 4 legs, the 4 rows are for the front right, front left, rear right and rear left legs, the pattern length is 5 (=0.1s). |\n| steps/observation/desired_vel | Tensor | (3,) | float32 | Desired velocites. The first 2 are linear velocities along and perpendicular to the heading direction, the 3rd is the desired angular velocity about the yaw axis. |\n| steps/observation/image | Image | (64, 64, 3) | uint8 | Dummy camera RGB observation. |\n| steps/observation/prev_act | Tensor | (12,) | float32 | Actions applied in the previous step. |\n| steps/observation/proj_grav_vec | Tensor | (3,) | float32 | The gravity vector \\[0, 0, -1\\] in the robot base frame. |\n| steps/observation/state | Tensor | (30,) | float32 | Robot state, consists of \\[3x robot base linear velocity, 3x base angular vel, 12x joint position, 12x joint velocity\\]. |\n| steps/observation/wrist_image | Image | (64, 64, 3) | uint8 | Dummy wrist camera RGB observation. |\n| steps/reward | Scalar | | float32 | Reward if provided, 1 on final step for demos. |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Examples**\n ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\n- **Citation**:\n\n @article{saytap2023,\n author = {Yujin Tang and Wenhao Yu and Jie Tan and Heiga Zen and Aleksandra Faust and\n Tatsuya Harada},\n title = {SayTap: Language to Quadrupedal Locomotion},\n eprint = {arXiv:2306.07580},\n url = {https://saytap.github.io},\n note = \"{https://saytap.github.io}\",\n year = {2023}\n }"]]