dsprite

dSprites adalah kumpulan data bentuk 2D yang dihasilkan secara prosedural dari 6 faktor laten independen kebenaran dasar. Faktor-faktor ini warna, bentuk, skala, rotasi, x dan posisi y dari sprite.

Semua kemungkinan kombinasi dari laten ini hadir tepat satu kali, menghasilkan N = 737280 total gambar.

Nilai faktor laten

  • Warna putih
  • Bentuk: persegi, elips, hati
  • Skala: 6 nilai spasi linier di [0,5, 1]
  • Orientasi: 40 nilai dalam [0, 2 pi]
  • Posisi X: 32 nilai dalam [0, 1]
  • Posisi Y: 32 nilai dalam [0, 1]

Kami memvariasikan satu laten pada satu waktu (mulai dari Posisi Y, lalu Posisi X, dll), dan secara berurutan menyimpan gambar dalam urutan tetap. Oleh karena itu urutan di sepanjang dimensi pertama adalah tetap dan memungkinkan Anda untuk memetakan kembali ke nilai laten yang sesuai dengan gambar itu.

Kami memilih nilai laten dengan sengaja untuk memiliki perubahan langkah terkecil sambil memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.

Membelah Contoh
'train' 737.280
  • fitur:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

visualisasi

  • Citation:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}