dsprites

dSprites, 6 temel gerçek bağımsız gizli faktörden prosedürel olarak oluşturulan 2B şekillerden oluşan bir veri kümesidir. Bu faktörler renk, biçim, ölçek, döndürme, x ve hareketli grafiğin y pozisyonları bulunmaktadır.

Bu gizillerin tüm olası kombinasyonları tam olarak bir kez mevcuttur ve N = 737280 toplam görüntü oluşturur.

Gizli faktör değerleri

  • Beyaz renk
  • Şekil: kare, elips, kalp
  • Ölçek: [0.5, 1] ​​içinde doğrusal olarak aralıklı 6 değer
  • Oryantasyon: [0, 2 pi]'de 40 değer
  • Konum X: [0, 1] içinde 32 değer
  • Konum Y: [0, 1] içinde 32 değer

Her seferinde bir gizli değişkeni değiştirdik (Y Konumundan başlayarak, ardından X Konumundan vb.) ve görüntüleri sırayla sabit sırayla depoladık. Bu nedenle, ilk boyut boyunca sıra sabittir ve o görüntüye karşılık gelen gizli değerlerin değerine geri dönmenize izin verir.

Tüm piksel çıktılarının farklı olmasını sağlarken, en küçük adım değişikliklerine sahip olmak için gizli değerleri bilerek seçtik. Gürültü eklenmedi.

Bölmek Örnekler
'train' 737,280
  • Özellikler:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

görselleştirme

  • Citation:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}