dsprites

  • Opis :

dSprites to zbiór danych kształtów 2D wygenerowanych proceduralnie na podstawie 6 niezależnych od prawdy czynników ukrytych. Czynniki te to kolor , kształt , skala , obrót , pozycje x i y duszka.

Wszystkie możliwe kombinacje tych latencji występują dokładnie raz, generując łącznie N = 737280 obrazów.

Ukryte wartości czynników

  • Kolor biały
  • Kształt: kwadrat, elipsa, serce
  • Skala: 6 wartości rozmieszczonych liniowo w [0,5, 1]
  • Orientacja: 40 wartości w [0, 2 pi]
  • Pozycja X: 32 wartości w [0, 1]
  • Pozycja Y: 32 wartości w [0, 1]

Zmienialiśmy po jednym ukryciu na raz (zaczynając od pozycji Y, następnie pozycji X itd.) i sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności. W związku z tym kolejność w pierwszym wymiarze jest stała i pozwala na odwzorowanie wartości ukrytych odpowiadających temu obrazowi.

Celowo wybraliśmy wartości ukryte, aby zmiany były najmniejsze, zapewniając jednocześnie, że wyniki wszystkich pikseli były różne. Nie dodano żadnego hałasu.

Podział Przykłady
'train' 737280
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
obraz Obraz (64, 64, 1) uint8
orientacja_etykiety Etykieta klasy int64
etykieta_skala Etykieta klasy int64
etykieta_kształt Etykieta klasy int64
etykieta_x_pozycja Etykieta klasy int64
pozycja_etykiety Etykieta klasy int64
orientacja_wartości Napinacz pływak32
skala wartości Napinacz pływak32
wartość_kształt Napinacz pływak32
wartość_x_pozycja Napinacz pływak32
wartość_y_pozycji Napinacz pływak32

Wyobrażanie sobie

  • Cytat :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}