formas3d

  • Descrição :

3dshapes é um conjunto de dados de formas 3D geradas processualmente a partir de 6 fatores latentes independentes da verdade básica. Esses fatores são a cor do piso , a cor da parede , a cor do objeto , a escala , a forma e a orientação .

Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 480.000 imagens no total.

Valores de fator latente

  • matiz do piso: 10 valores espaçados linearmente em [0, 1]
  • matiz da parede: 10 valores espaçados linearmente em [0, 1]
  • matiz do objeto: 10 valores espaçados linearmente em [0, 1]
  • escala: 8 valores espaçados linearmente em [0, 1]
  • forma: 4 valores em [0, 1, 2, 3]
  • orientação: 15 valores espaçados linearmente em [-30, 30]

Variamos uma latente de cada vez (começando pela orientação, depois pela forma, etc.) e armazenamos sequencialmente as imagens em ordem fixa no array images . Os valores correspondentes dos fatores são armazenados na mesma ordem na matriz labels .

Dividir Exemplos
'train' 480.000
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
imagem Imagem (64, 64, 3) uint8
label_floor_hue ClassLabel int64
rótulo_objeto_hue ClassLabel int64
etiqueta_orientação ClassLabel int64
etiqueta_escala ClassLabel int64
forma_da_rótulo ClassLabel int64
label_wall_hue ClassLabel int64
valor_floor_hue Tensor float32
valor_objeto_matiz Tensor float32
orientação_valor Tensor float32
escala_valor Tensor float32
valor_forma Tensor float32
valor_wall_hue Tensor float32

Visualização

  • Citação :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}