sprites

  • Descrição :

dSprites é um conjunto de dados de formas 2D geradas processualmente a partir de 6 fatores latentes independentes da verdade básica. Esses fatores são cor , forma , escala , rotação e posições x e y de um sprite.

Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 737.280 imagens no total.

Valores de fator latente

  • Cor branca
  • Forma: quadrado, elipse, coração
  • Escala: 6 valores espaçados linearmente em [0,5, 1]
  • Orientação: 40 valores em [0, 2 pi]
  • Posição X: 32 valores em [0, 1]
  • Posição Y: 32 valores em [0, 1]

Variamos uma latente de cada vez (começando na posição Y, depois na posição X, etc.) e armazenamos sequencialmente as imagens em ordem fixa. Conseqüentemente, a ordem ao longo da primeira dimensão é fixa e permite mapear de volta ao valor das latentes correspondentes a essa imagem.

Escolhemos os valores latentes deliberadamente para ter as menores alterações de passo e, ao mesmo tempo, garantir que todas as saídas de pixel fossem diferentes. Nenhum ruído foi adicionado.

Dividir Exemplos
'train' 737.280
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
imagem Imagem (64, 64, 1) uint8
etiqueta_orientação ClassLabel int64
etiqueta_escala ClassLabel int64
forma_da_rótulo ClassLabel int64
etiqueta_x_posição ClassLabel int64
etiqueta_y_posição ClassLabel int64
orientação_valor Tensor float32
escala_valor Tensor float32
valor_forma Tensor float32
valor_x_posição Tensor float32
valor_y_posição Tensor float32

Visualização

  • Citação :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}