formas3d

  • Descripción :

3dshapes es un conjunto de datos de formas 3D generadas procedimentalmente a partir de 6 factores latentes independientes de la verdad fundamental. Estos factores son el color del piso , el color de la pared , el color del objeto , la escala , la forma y la orientación .

Todas las combinaciones posibles de estas latentes están presentes exactamente una vez, generando N = 480000 imágenes en total.

Valores de factores latentes

  • tono del suelo: 10 valores espaciados linealmente en [0, 1]
  • tono de la pared: 10 valores espaciados linealmente en [0, 1]
  • tono del objeto: 10 valores espaciados linealmente en [0, 1]
  • escala: 8 valores espaciados linealmente en [0, 1]
  • forma: 4 valores en [0, 1, 2, 3]
  • orientación: 15 valores espaciados linealmente en [-30, 30]

Variamos una latente a la vez (comenzando por la orientación, luego la forma, etc.) y almacenamos secuencialmente las imágenes en un orden fijo en la matriz images . Los valores correspondientes de los factores se almacenan en el mismo orden en la matriz labels .

Dividir Ejemplos
'train' 480.000
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
imagen Imagen (64, 64, 3) uint8
etiqueta_piso_hue Etiqueta de clase int64
etiqueta_objeto_hue Etiqueta de clase int64
orientación_etiqueta Etiqueta de clase int64
escala_etiqueta Etiqueta de clase int64
forma_etiqueta Etiqueta de clase int64
etiqueta_pared_hue Etiqueta de clase int64
valor_piso_hue Tensor flotador32
valor_objeto_hue Tensor flotador32
orientación de valores Tensor flotador32
escala_valor Tensor flotador32
valor_forma Tensor flotador32
valor_pared_hue Tensor flotador32

Visualización

  • Citación :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}