formes3d

  • Description :

3dshapes est un ensemble de données de formes 3D générées de manière procédurale à partir de 6 facteurs latents indépendants de la vérité terrain. Ces facteurs sont la couleur du sol , la couleur des murs , la couleur de l'objet , l'échelle , la forme et l'orientation .

Toutes les combinaisons possibles de ces latents sont présentes exactement une fois, générant N = 480 000 images au total.

Valeurs des facteurs latents

  • teinte du sol : 10 valeurs espacées linéairement dans [0, 1]
  • teinte du mur : 10 valeurs espacées linéairement dans [0, 1]
  • teinte de l'objet : 10 valeurs espacées linéairement dans [0, 1]
  • échelle : 8 valeurs espacées linéairement en [0, 1]
  • forme : 4 valeurs dans [0, 1, 2, 3]
  • orientation : 15 valeurs espacées linéairement dans [-30, 30]

Nous avons fait varier une latente à la fois (en commençant par l'orientation, puis la forme, etc.) et avons stocké séquentiellement les images dans un ordre fixe dans le tableau images . Les valeurs correspondantes des facteurs sont stockées dans le même ordre dans le tableau labels .

Diviser Exemples
'train' 480 000
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
image Image (64, 64, 3) uint8
label_floor_hue Étiquette de classe int64
label_object_hue Étiquette de classe int64
étiquette_orientation Étiquette de classe int64
étiquette_scale Étiquette de classe int64
forme_étiquette Étiquette de classe int64
label_wall_hue Étiquette de classe int64
value_floor_hue Tenseur flotteur32
valeur_objet_hue Tenseur flotteur32
valeur_orientation Tenseur flotteur32
valeur_échelle Tenseur flotteur32
forme_valeur Tenseur flotteur32
valeur_wall_hue Tenseur flotteur32

Visualisation

  • Citation :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}