hình dạng3d

3dshapes là một bộ dữ liệu gồm các hình dạng 3D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật cơ bản. Những yếu tố này là màu sàn, màu tường, màu đối tượng , tỷ lệ , hình dạnghướng .

Tất cả các kết hợp có thể có của các điểm tiềm ẩn này đều xuất hiện chính xác một lần, tạo ra tổng số N = 480000 hình ảnh.

Giá trị yếu tố tiềm ẩn

  • màu nền: 10 giá trị được đặt cách đều nhau trong [0, 1]
  • màu tường: 10 giá trị cách đều nhau trong [0, 1]
  • sắc độ của đối tượng: 10 giá trị cách đều nhau trong [0, 1]
  • tỷ lệ: 8 giá trị cách đều nhau trong [0, 1]
  • hình dạng: 4 giá trị trong [0, 1, 2, 3]
  • định hướng: 15 giá trị cách đều tuyến tính trong [-30, 30]

Chúng tôi thay đổi từng tiềm ẩn một (bắt đầu từ định hướng, sau đó là hình dạng, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định trong mảng images . Các giá trị tương ứng của các yếu tố được lưu trữ theo cùng một thứ tự trong mảng labels .

Tách ra ví dụ
'train' 480.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (64, 64, 3) uint8
nhãn_sàn_hue LớpNhãn int64
nhãn_đối tượng_hue LớpNhãn int64
nhãn_orientation LớpNhãn int64
nhãn_scale LớpNhãn int64
nhãn_hình dạng LớpNhãn int64
nhãn_wall_hue LớpNhãn int64
giá_trị_sàn_hue tenxơ phao32
value_object_hue tenxơ phao32
value_orientation tenxơ phao32
value_scale tenxơ phao32
value_shape tenxơ phao32
value_wall_hue tenxơ phao32

Hình dung

  • trích dẫn :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}