- Keterangan :
dSprites adalah kumpulan data bentuk 2D yang dihasilkan secara prosedural dari 6 faktor laten independen kebenaran dasar. Faktor-faktor tersebut adalah warna , bentuk , skala , rotasi , posisi x dan y dari sebuah sprite.
Semua kemungkinan kombinasi laten ini muncul tepat satu kali, menghasilkan total N = 737280 gambar.
Nilai faktor laten
- Warna putih
- Bentuk: persegi, elips, hati
- Skala: 6 nilai dengan jarak linier dalam [0,5, 1]
- Orientasi: 40 nilai dalam [0, 2 pi]
- Posisi X: 32 nilai di [0, 1]
- Posisi Y: 32 nilai di [0, 1]
Kami memvariasikan laten satu per satu (mulai dari Posisi Y, lalu Posisi X, dll), dan menyimpan gambar secara berurutan dalam urutan tetap. Oleh karena itu, urutan sepanjang dimensi pertama adalah tetap dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar tersebut.
Kami sengaja memilih nilai laten untuk mendapatkan perubahan langkah terkecil sekaligus memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.
Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Kode sumber :
tfds.datasets.dsprites.Builder
Versi :
-
2.0.0
(default): API terpisah baru ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Tidak ada catatan rilis.
-
Ukuran unduhan :
26.73 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 737.280 |
- Struktur fitur :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
gambar | Gambar | (64, 64, 1) | uint8 | |
label_orientasi | Label Kelas | int64 | ||
label_skala | Label Kelas | int64 | ||
label_bentuk | Label Kelas | int64 | ||
label_x_posisi | Label Kelas | int64 | ||
label_y_posisi | Label Kelas | int64 | ||
orientasi_nilai | Tensor | float32 | ||
skala_nilai | Tensor | float32 | ||
nilai_bentuk | Tensor | float32 | ||
nilai_x_posisi | Tensor | float32 | ||
nilai_y_posisi | Tensor | float32 |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}