hình dạng3d

3dshapes là một tập dữ liệu về các hình dạng 3D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật trên mặt đất. Những yếu tố này là màu sàn, màu tường, màu vật thể , tỷ lệ , hình dạnghướng .

Tất cả các kết hợp có thể có của những độ trễ này đều xuất hiện đúng một lần, tạo ra tổng số N = 480000 hình ảnh.

Giá trị yếu tố tiềm ẩn

  • màu sàn: 10 giá trị được phân cách tuyến tính trong [0, 1]
  • màu tường: 10 giá trị được phân cách tuyến tính trong [0, 1]
  • màu sắc đối tượng: 10 giá trị được phân cách tuyến tính trong [0, 1]
  • scale: 8 giá trị được viết cách tuyến tính trong [0, 1]
  • shape: 4 giá trị trong [0, 1, 2, 3]
  • định hướng: 15 giá trị được phân cách tuyến tính trong [-30, 30]

Chúng tôi thay đổi từng mức độ tiềm ẩn tại một thời điểm (bắt đầu từ định hướng, sau đó là hình dạng, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định trong mảng images . Các giá trị tương ứng của các yếu tố được lưu trữ theo cùng một thứ tự trong mảng labels .

Tách ra Các ví dụ
'train' 480.000
  • Các tính năng :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

Hình dung

  • Trích dẫn :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}