- Descrição :
3dshapes é um conjunto de dados de formas 3D geradas processualmente a partir de 6 fatores latentes independentes da verdade básica. Esses fatores são a cor do piso , a cor da parede , a cor do objeto , a escala , a forma e a orientação .
Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 480.000 imagens no total.
Valores de fator latente
- matiz do piso: 10 valores espaçados linearmente em [0, 1]
- matiz da parede: 10 valores espaçados linearmente em [0, 1]
- matiz do objeto: 10 valores espaçados linearmente em [0, 1]
- escala: 8 valores espaçados linearmente em [0, 1]
- forma: 4 valores em [0, 1, 2, 3]
- orientação: 15 valores espaçados linearmente em [-30, 30]
Variamos uma latente de cada vez (começando pela orientação, depois pela forma, etc.) e armazenamos sequencialmente as imagens em ordem fixa no array images
. Os valores correspondentes dos fatores são armazenados na mesma ordem na matriz labels
.
Documentação adicional : Explore artigos com código
Página inicial : https://github.com/deepmind/3d-shapes
Código fonte :
tfds.datasets.shapes3d.Builder
Versões :
-
2.0.0
(padrão): Nova API dividida ( https://tensorflow.org/datasets/splits )
-
Tamanho do download :
255.18 MiB
Tamanho do conjunto de dados :
1.68 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 480.000 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (64, 64, 3) | uint8 | |
label_floor_hue | ClassLabel | int64 | ||
rótulo_objeto_hue | ClassLabel | int64 | ||
etiqueta_orientação | ClassLabel | int64 | ||
etiqueta_escala | ClassLabel | int64 | ||
forma_da_rótulo | ClassLabel | int64 | ||
label_wall_hue | ClassLabel | int64 | ||
valor_floor_hue | Tensor | float32 | ||
valor_objeto_matiz | Tensor | float32 | ||
orientação_valor | Tensor | float32 | ||
escala_valor | Tensor | float32 | ||
valor_forma | Tensor | float32 | ||
valor_wall_hue | Tensor | float32 |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}