形状3D
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
3dshapes は、6 つのグラウンド トゥルースの独立した潜在要素から手続き的に生成された 3D 形状のデータセットです。これらの要素は、床の色、壁の色、オブジェクトの色、スケール、形状、向きです。
これらの潜在的な組み合わせはすべて 1 回だけ存在し、合計 N = 480000 の画像が生成されます。
潜在因子の値
- 床の色相: [0, 1] で直線的に配置された 10 個の値
- 壁の色相: [0, 1] で直線的に配置された 10 個の値
- オブジェクトの色相: [0, 1] で直線的に配置された 10 個の値
- スケール: [0, 1] で直線的に配置された 8 つの値
- 形状: [0、1、2、3] の 4 つの値
- 方向: [-30, 30] で直線的に配置された 15 個の値
一度に 1 つの潜在要素を変更し (方向から始めて、次に形状など)、画像を固定順序でimages
配列に順次保存しました。因子の対応する値は、 labels
配列に同じ順序で格納されます。
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
特徴 | クラス | 形 | Dタイプ | 説明 |
---|
| 特徴辞書 | | | |
画像 | 画像 | (64、64、3) | uint8 | |
ラベルフロア_色相 | クラスラベル | | int64 | |
label_object_hue | クラスラベル | | int64 | |
ラベルの向き | クラスラベル | | int64 | |
ラベルスケール | クラスラベル | | int64 | |
ラベルの形状 | クラスラベル | | int64 | |
label_wall_hue | クラスラベル | | int64 | |
値の床の色相 | テンソル | | float32 | |
値オブジェクトの色相 | テンソル | | float32 | |
値の方向 | テンソル | | float32 | |
値のスケール | テンソル | | float32 | |
値の形状 | テンソル | | float32 | |
値の壁の色相 | テンソル | | float32 | |

@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-06-01 UTC。
[null,null,["最終更新日 2024-06-01 UTC。"],[],[],null,["# shapes3d\n\n\u003cbr /\u003e\n\n- **Description**:\n\n3dshapes is a dataset of 3D shapes procedurally generated from 6 ground truth\nindependent latent factors. These factors are *floor colour* , *wall colour* ,\n*object colour* , *scale* , *shape* and *orientation*.\n\nAll possible combinations of these latents are present exactly once, generating\nN = 480000 total images.\n\n### Latent factor values\n\n- floor hue: 10 values linearly spaced in \\[0, 1\\]\n- wall hue: 10 values linearly spaced in \\[0, 1\\]\n- object hue: 10 values linearly spaced in \\[0, 1\\]\n- scale: 8 values linearly spaced in \\[0, 1\\]\n- shape: 4 values in \\[0, 1, 2, 3\\]\n- orientation: 15 values linearly spaced in \\[-30, 30\\]\n\nWe varied one latent at a time (starting from orientation, then shape, etc), and\nsequentially stored the images in fixed order in the `images` array. The\ncorresponding values of the factors are stored in the same order in the `labels`\narray.\n\n- **Additional Documentation** :\n [Explore on Papers With Code\n north_east](https://paperswithcode.com/dataset/3d-shapes-dataset)\n\n- **Homepage** :\n \u003chttps://github.com/deepmind/3d-shapes\u003e\n\n- **Source code** :\n [`tfds.datasets.shapes3d.Builder`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/datasets/shapes3d/shapes3d_dataset_builder.py)\n\n- **Versions**:\n\n - **`2.0.0`** (default): New split API (\u003chttps://tensorflow.org/datasets/splits\u003e)\n- **Download size** : `255.18 MiB`\n\n- **Dataset size** : `1.68 GiB`\n\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n No\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'train'` | 480,000 |\n\n- **Feature structure**:\n\n FeaturesDict({\n 'image': Image(shape=(64, 64, 3), dtype=uint8),\n 'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),\n 'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),\n 'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),\n 'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),\n 'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),\n 'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),\n 'value_floor_hue': float32,\n 'value_object_hue': float32,\n 'value_orientation': float32,\n 'value_scale': float32,\n 'value_shape': float32,\n 'value_wall_hue': float32,\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|-------------------|--------------|-------------|---------|-------------|\n| | FeaturesDict | | | |\n| image | Image | (64, 64, 3) | uint8 | |\n| label_floor_hue | ClassLabel | | int64 | |\n| label_object_hue | ClassLabel | | int64 | |\n| label_orientation | ClassLabel | | int64 | |\n| label_scale | ClassLabel | | int64 | |\n| label_shape | ClassLabel | | int64 | |\n| label_wall_hue | ClassLabel | | int64 | |\n| value_floor_hue | Tensor | | float32 | |\n| value_object_hue | Tensor | | float32 | |\n| value_orientation | Tensor | | float32 | |\n| value_scale | Tensor | | float32 | |\n| value_shape | Tensor | | float32 | |\n| value_wall_hue | Tensor | | float32 | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\n- **Citation**:\n\n @misc{3dshapes18,\n title={3D Shapes Dataset},\n author={Burgess, Chris and Kim, Hyunjik},\n howpublished={https://github.com/deepmind/3dshapes-dataset/},\n year={2018}\n }"]]