sprite

  • Keterangan :

dSprites adalah kumpulan data bentuk 2D yang dihasilkan secara prosedural dari 6 faktor laten independen kebenaran dasar. Faktor-faktor tersebut adalah warna , bentuk , skala , rotasi , posisi x dan y dari sebuah sprite.

Semua kemungkinan kombinasi laten ini muncul tepat satu kali, menghasilkan total N = 737280 gambar.

Nilai faktor laten

  • Warna putih
  • Bentuk: persegi, elips, hati
  • Skala: 6 nilai dengan jarak linier dalam [0,5, 1]
  • Orientasi: 40 nilai dalam [0, 2 pi]
  • Posisi X: 32 nilai di [0, 1]
  • Posisi Y: 32 nilai di [0, 1]

Kami memvariasikan laten satu per satu (mulai dari Posisi Y, lalu Posisi X, dll), dan menyimpan gambar secara berurutan dalam urutan tetap. Oleh karena itu, urutan sepanjang dimensi pertama adalah tetap dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar tersebut.

Kami sengaja memilih nilai laten untuk mendapatkan perubahan langkah terkecil sekaligus memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.

Membelah Contoh
'train' 737.280
  • Struktur fitur :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
gambar Gambar (64, 64, 1) uint8
label_orientasi Label Kelas int64
label_skala Label Kelas int64
label_bentuk Label Kelas int64
label_x_posisi Label Kelas int64
label_y_posisi Label Kelas int64
orientasi_nilai Tensor float32
skala_nilai Tensor float32
nilai_bentuk Tensor float32
nilai_x_posisi Tensor float32
nilai_y_posisi Tensor float32

Visualisasi

  • Kutipan :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}