- Tanım :
dSprites, temel gerçeklikten bağımsız 6 gizli faktörden prosedürel olarak oluşturulan 2 boyutlu şekillerden oluşan bir veri kümesidir. Bu faktörler bir hareketli grafiğin rengi , şekli , ölçeği , dönüşü , x ve y konumlarıdır.
Bu gizli öğelerin tüm olası kombinasyonları tam olarak bir kez mevcut olup N = 737280 toplam görüntü oluşturulur.
Gizli faktör değerleri
- Beyaz renk
- Şekil: kare, elips, kalp
- Ölçek: [0,5, 1] aralığında doğrusal olarak aralıklı 6 değer
- Yön: [0, 2 pi] cinsinden 40 değer
- X Konumu: [0, 1]'de 32 değer
- Y Konumu: [0, 1]'de 32 değer
Her seferinde gizli olanı değiştirdik (Y Konumundan başlayarak, ardından X Konumundan vb. başlayarak) ve görüntüleri sabit sırayla sırayla depoladık. Bu nedenle, ilk boyut boyunca sıra sabittir ve o görüntüye karşılık gelen gizli değerlerin değerine geri eşleme yapmanıza olanak tanır.
Tüm piksel çıktılarının farklı olmasını sağlarken gizli değerleri en küçük adım değişikliklerine sahip olacak şekilde bilinçli olarak seçtik. Gürültü eklenmedi.
Ana sayfa : https://github.com/deepmind/dsprites-dataset
Kaynak kodu :
tfds.datasets.dsprites.Builder
Sürümler :
-
2.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Sürüm notu yok.
-
İndirme boyutu :
26.73 MiB
Veri kümesi boyutu :
Unknown size
Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 737.280 |
- Özellik yapısı :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
görüntü | Resim | (64, 64, 1) | uint8 | |
label_orientation | SınıfEtiketi | int64 | ||
label_scale | SınıfEtiketi | int64 | ||
etiket_şekli | SınıfEtiketi | int64 | ||
label_x_position | SınıfEtiketi | int64 | ||
label_y_position | SınıfEtiketi | int64 | ||
Değer oryantasyonu | Tensör | kayan nokta32 | ||
değer_ölçeği | Tensör | kayan nokta32 | ||
değer_şekli | Tensör | kayan nokta32 | ||
değer_x_konumu | Tensör | kayan nokta32 | ||
value_y_position | Tensör | kayan nokta32 |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}