dsprites

dSprites est un ensemble de données de formes 2D générées de manière procédurale à partir de 6 facteurs latents indépendants de la vérité terrain. Ces facteurs sont la couleur, la forme, l' échelle, la rotation, positions x et y d'une image - objet.

Toutes les combinaisons possibles de ces latents sont présentes exactement une fois, générant N = 737280 images au total.

Valeurs des facteurs latents

  • Couleur blanche
  • Forme : carré, ellipse, coeur
  • Echelle : 6 valeurs espacées linéairement en [0,5, 1]
  • Orientation : 40 valeurs en [0, 2 pi]
  • Position X : 32 valeurs dans [0, 1]
  • Position Y : 32 valeurs dans [0, 1]

Nous avons varié une latente à la fois (à partir de la position Y, puis de la position X, etc.) et stocké séquentiellement les images dans un ordre fixe. Par conséquent, l'ordre le long de la première dimension est fixe et vous permet de revenir à la valeur des latents correspondant à cette image.

Nous avons délibérément choisi les valeurs latentes pour avoir les plus petits changements d'étape tout en nous assurant que toutes les sorties de pixels étaient différentes. Aucun bruit n'a été ajouté.

Diviser Exemples
'train' 737 280
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

Visualisation

  • citation:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}