uiuc_d3フィールド
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
事務机や食器などの整理整頓
FeaturesDict({
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
}),
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=float32, description=Robot displacement from last frame),
'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'depth_1': Image(shape=(360, 640, 1), dtype=uint16, description=camera 1 depth observation.),
'depth_2': Image(shape=(360, 640, 1), dtype=uint16, description=camera 2 depth observation.),
'depth_3': Image(shape=(360, 640, 1), dtype=uint16, description=camera 3 depth observation.),
'depth_4': Image(shape=(360, 640, 1), dtype=uint16, description=camera 4 depth observation.),
'image_1': Image(shape=(360, 640, 3), dtype=uint8, description=camera 1 RGB observation.),
'image_2': Image(shape=(360, 640, 3), dtype=uint8, description=camera 2 RGB observation.),
'image_3': Image(shape=(360, 640, 3), dtype=uint8, description=camera 3 RGB observation.),
'image_4': Image(shape=(360, 640, 3), dtype=uint8, description=camera 4 RGB observation.),
'state': Tensor(shape=(4, 4), dtype=float32, description=Robot end-effector state),
}),
'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
}),
})
特徴 | クラス | 形 | Dタイプ | 説明 |
---|
| 特徴辞書 | | | |
エピソード_メタデータ | 特徴辞書 | | | |
エピソードメタデータ/ファイルパス | 文章 | | 弦 | 元のデータ ファイルへのパス。 |
ステップ | データセット | | | |
ステップ/アクション | テンソル | (3,) | float32 | 最後のフレームからのロボットの変位 |
歩数/割引 | スカラー | | float32 | 割引が指定されている場合、デフォルトは 1 です。 |
ステップ/is_first | テンソル | | ブール | |
ステップ/is_last | テンソル | | ブール | |
ステップ/is_terminal | テンソル | | ブール | |
ステップ/言語_埋め込み | テンソル | (512,) | float32 | コナ言語の埋め込み。 https://tfhub.dev/google/universal-sentence-encoder-large/5 を参照してください。 |
ステップ/言語説明 | 文章 | | 弦 | 言語指導。 |
ステップ/観察 | 特徴辞書 | | | |
歩数/観察/深さ_1 | 画像 | (360、640、1) | uint16 | カメラ 1 深度観察。 |
歩数/観察/深さ_2 | 画像 | (360、640、1) | uint16 | カメラ2深度観察。 |
歩数/観察/深さ_3 | 画像 | (360、640、1) | uint16 | カメラ3深度観察。 |
歩数/観察/深さ_4 | 画像 | (360、640、1) | uint16 | カメラ4深度観察。 |
ステップ/観察/画像_1 | 画像 | (360、640、3) | uint8 | カメラ1 RGB観察。 |
ステップ/観察/画像_2 | 画像 | (360、640、3) | uint8 | カメラ2 RGB観察。 |
ステップ/観察/画像_3 | 画像 | (360、640、3) | uint8 | カメラ3 RGB観察。 |
ステップ/観察/画像_4 | 画像 | (360、640、3) | uint8 | カメラ4 RGB観察。 |
ステップ/観察/状態 | テンソル | (4,4) | float32 | ロボットのエンドエフェクターの状態 |
歩数/報酬 | スカラー | | float32 | 提供されている場合は報酬、デモの最終ステップで 1。 |
@article{wang2023d3field,
title={D^3Field: Dynamic 3D Descriptor Fields for Generalizable Robotic Manipulation},
author={Wang, Yixuan and Li, Zhuoran and Zhang, Mingtong and Driggs-Campbell, Katherine and Wu, Jiajun and Fei-Fei, Li and Li, Yunzhu},
journal={arXiv preprint arXiv:},
year={2023},
}
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-12-18 UTC。
[null,null,["最終更新日 2024-12-18 UTC。"],[],[],null,["# uiuc_d3field\n\n\u003cbr /\u003e\n\n- **Description**:\n\nOrganizing office desk, utensils etc\n\n- **Homepage** :\n \u003chttps://robopil.github.io/d3fields/\u003e\n\n- **Source code** :\n [`tfds.robotics.rtx.UiucD3field`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/robotics/rtx/rtx.py)\n\n- **Versions**:\n\n - **`0.1.0`** (default): Initial release.\n- **Download size** : `Unknown size`\n\n- **Dataset size** : `15.82 GiB`\n\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n No\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'train'` | 192 |\n\n- **Feature structure**:\n\n FeaturesDict({\n 'episode_metadata': FeaturesDict({\n 'file_path': Text(shape=(), dtype=string),\n }),\n 'steps': Dataset({\n 'action': Tensor(shape=(3,), dtype=float32, description=Robot displacement from last frame),\n 'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),\n 'is_first': bool,\n 'is_last': bool,\n 'is_terminal': bool,\n 'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),\n 'language_instruction': Text(shape=(), dtype=string),\n 'observation': FeaturesDict({\n 'depth_1': Image(shape=(360, 640, 1), dtype=uint16, description=camera 1 depth observation.),\n 'depth_2': Image(shape=(360, 640, 1), dtype=uint16, description=camera 2 depth observation.),\n 'depth_3': Image(shape=(360, 640, 1), dtype=uint16, description=camera 3 depth observation.),\n 'depth_4': Image(shape=(360, 640, 1), dtype=uint16, description=camera 4 depth observation.),\n 'image_1': Image(shape=(360, 640, 3), dtype=uint8, description=camera 1 RGB observation.),\n 'image_2': Image(shape=(360, 640, 3), dtype=uint8, description=camera 2 RGB observation.),\n 'image_3': Image(shape=(360, 640, 3), dtype=uint8, description=camera 3 RGB observation.),\n 'image_4': Image(shape=(360, 640, 3), dtype=uint8, description=camera 4 RGB observation.),\n 'state': Tensor(shape=(4, 4), dtype=float32, description=Robot end-effector state),\n }),\n 'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),\n }),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|----------------------------|--------------|---------------|---------|--------------------------------------------------------------------------------------------|\n| | FeaturesDict | | | |\n| episode_metadata | FeaturesDict | | | |\n| episode_metadata/file_path | Text | | string | Path to the original data file. |\n| steps | Dataset | | | |\n| steps/action | Tensor | (3,) | float32 | Robot displacement from last frame |\n| steps/discount | Scalar | | float32 | Discount if provided, default to 1. |\n| steps/is_first | Tensor | | bool | |\n| steps/is_last | Tensor | | bool | |\n| steps/is_terminal | Tensor | | bool | |\n| steps/language_embedding | Tensor | (512,) | float32 | Kona language embedding. See \u003chttps://tfhub.dev/google/universal-sentence-encoder-large/5\u003e |\n| steps/language_instruction | Text | | string | Language Instruction. |\n| steps/observation | FeaturesDict | | | |\n| steps/observation/depth_1 | Image | (360, 640, 1) | uint16 | camera 1 depth observation. |\n| steps/observation/depth_2 | Image | (360, 640, 1) | uint16 | camera 2 depth observation. |\n| steps/observation/depth_3 | Image | (360, 640, 1) | uint16 | camera 3 depth observation. |\n| steps/observation/depth_4 | Image | (360, 640, 1) | uint16 | camera 4 depth observation. |\n| steps/observation/image_1 | Image | (360, 640, 3) | uint8 | camera 1 RGB observation. |\n| steps/observation/image_2 | Image | (360, 640, 3) | uint8 | camera 2 RGB observation. |\n| steps/observation/image_3 | Image | (360, 640, 3) | uint8 | camera 3 RGB observation. |\n| steps/observation/image_4 | Image | (360, 640, 3) | uint8 | camera 4 RGB observation. |\n| steps/observation/state | Tensor | (4, 4) | float32 | Robot end-effector state |\n| steps/reward | Scalar | | float32 | Reward if provided, 1 on final step for demos. |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Examples**\n ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\n- **Citation**:\n\n @article{wang2023d3field,\n title={D^3Field: Dynamic 3D Descriptor Fields for Generalizable Robotic Manipulation},\n author={Wang, Yixuan and Li, Zhuoran and Zhang, Mingtong and Driggs-Campbell, Katherine and Wu, Jiajun and Fei-Fei, Li and Li, Yunzhu},\n journal={arXiv preprint arXiv:},\n year={2023},\n }"]]