Trực quan hóa : Khám phá khi biết dữ liệu của bạn
Mô tả :
3dshapes là một bộ dữ liệu gồm các hình dạng 3D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật cơ bản. Những yếu tố này là màu sàn, màu tường, màu đối tượng , tỷ lệ , hình dạng và hướng .
Tất cả các kết hợp có thể có của các điểm tiềm ẩn này đều xuất hiện chính xác một lần, tạo ra tổng số N = 480000 hình ảnh.
Giá trị yếu tố tiềm ẩn
- màu nền: 10 giá trị được đặt cách đều nhau trong [0, 1]
- màu tường: 10 giá trị cách đều nhau trong [0, 1]
- sắc độ của đối tượng: 10 giá trị cách đều nhau trong [0, 1]
- tỷ lệ: 8 giá trị cách đều nhau trong [0, 1]
- hình dạng: 4 giá trị trong [0, 1, 2, 3]
- định hướng: 15 giá trị cách đều tuyến tính trong [-30, 30]
Chúng tôi thay đổi từng tiềm ẩn một (bắt đầu từ định hướng, sau đó là hình dạng, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định trong mảng images
. Các giá trị tương ứng của các yếu tố được lưu trữ theo cùng một thứ tự trong mảng labels
.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/deepmind/3d-shapes
Mã nguồn :
tfds.datasets.shapes3d.Builder
Phiên bản :
-
2.0.0
(mặc định): API phân tách mới ( https://tensorflow.org/datasets/splits )
-
Kích thước tải xuống :
255.18 MiB
Kích thước tập dữ liệu :
1.68 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 480.000 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (64, 64, 3) | uint8 | |
nhãn_sàn_hue | LớpNhãn | int64 | ||
nhãn_đối tượng_hue | LớpNhãn | int64 | ||
nhãn_orientation | LớpNhãn | int64 | ||
nhãn_scale | LớpNhãn | int64 | ||
nhãn_hình dạng | LớpNhãn | int64 | ||
nhãn_wall_hue | LớpNhãn | int64 | ||
giá_trị_sàn_hue | tenxơ | phao32 | ||
value_object_hue | tenxơ | phao32 | ||
value_orientation | tenxơ | phao32 | ||
value_scale | tenxơ | phao32 | ||
value_shape | tenxơ | phao32 | ||
value_wall_hue | tenxơ | phao32 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}