Hình ảnh: Khám phá trong Know dữ liệu của bạn
Mô tả:
d Thủ phạm là một tập dữ liệu về các hình dạng 2D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật nền. Những yếu tố này là màu sắc, hình dạng, quy mô, luân chuyển, x và vị trí y của một sprite.
Tất cả các kết hợp có thể có của những độ trễ này đều xuất hiện đúng một lần, tạo ra tổng số N = 737280 hình ảnh.
Giá trị yếu tố tiềm ẩn
- Màu trắng
- Hình dạng: hình vuông, hình elip, trái tim
- Quy mô: 6 giá trị cách nhau tuyến tính trong [0,5, 1]
- Định hướng: 40 giá trị trong [0, 2 pi]
- Vị trí X: 32 giá trị trong [0, 1]
- Vị trí Y: 32 giá trị trong [0, 1]
Chúng tôi đã thay đổi một mức độ tiềm ẩn tại một thời điểm (bắt đầu từ Vị trí Y, sau đó đến Vị trí X, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định. Do đó, thứ tự dọc theo kích thước đầu tiên được cố định và cho phép bạn ánh xạ trở lại giá trị của độ trễ tương ứng với hình ảnh đó.
Chúng tôi đã cố ý chọn các giá trị tiềm ẩn để có những thay đổi từng bước nhỏ nhất trong khi đảm bảo rằng tất cả các kết quả đầu ra pixel là khác nhau. Không có tiếng ồn nào được thêm vào.
Trang chủ: https://github.com/deepmind/dsprites-dataset
Source code:
tfds.image.Dsprites
phiên bản:
-
2.0.0
(mặc định): New split API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Không có ghi chú phát hành.
-
Dung lượng tải về:
26.73 MiB
Kích thước tập dữ liệu:
Unknown size
Tự động lưu trữ ( tài liệu ): Unknown
tách:
Tách ra | Các ví dụ |
---|---|
'train' | 737.280 |
- Các tính năng:
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
'value_orientation': tf.float32,
'value_scale': tf.float32,
'value_shape': tf.float32,
'value_x_position': tf.float32,
'value_y_position': tf.float32,
})
Phím giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}