- Descrição :
dSprites é um conjunto de dados de formas 2D geradas processualmente a partir de 6 fatores latentes independentes da verdade básica. Esses fatores são cor , forma , escala , rotação e posições x e y de um sprite.
Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 737.280 imagens no total.
Valores de fator latente
- Cor branca
- Forma: quadrado, elipse, coração
- Escala: 6 valores espaçados linearmente em [0,5, 1]
- Orientação: 40 valores em [0, 2 pi]
- Posição X: 32 valores em [0, 1]
- Posição Y: 32 valores em [0, 1]
Variamos uma latente de cada vez (começando na posição Y, depois na posição X, etc.) e armazenamos sequencialmente as imagens em ordem fixa. Conseqüentemente, a ordem ao longo da primeira dimensão é fixa e permite mapear de volta ao valor das latentes correspondentes a essa imagem.
Escolhemos os valores latentes deliberadamente para ter as menores alterações de passo e, ao mesmo tempo, garantir que todas as saídas de pixel fossem diferentes. Nenhum ruído foi adicionado.
Documentação adicional : Explore artigos com código
Página inicial : https://github.com/deepmind/dsprites-dataset
Código fonte :
tfds.datasets.dsprites.Builder
Versões :
-
2.0.0
(padrão): Nova API dividida ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Sem notas de lançamento.
-
Tamanho do download :
26.73 MiB
Tamanho do conjunto de dados :
Unknown size
Armazenado em cache automaticamente ( documentação ): Desconhecido
Divisões :
Dividir | Exemplos |
---|---|
'train' | 737.280 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (64, 64, 1) | uint8 | |
etiqueta_orientação | ClassLabel | int64 | ||
etiqueta_escala | ClassLabel | int64 | ||
forma_da_rótulo | ClassLabel | int64 | ||
etiqueta_x_posição | ClassLabel | int64 | ||
etiqueta_y_posição | ClassLabel | int64 | ||
orientação_valor | Tensor | float32 | ||
escala_valor | Tensor | float32 | ||
valor_forma | Tensor | float32 | ||
valor_x_posição | Tensor | float32 | ||
valor_y_posição | Tensor | float32 |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}