đối xứng_solids

  • Mô tả:

Đây là tập dữ liệu ước tính tư thế, bao gồm các hình dạng 3D đối xứng trong đó nhiều hướng không thể phân biệt được bằng mắt thường. Thách thức là dự đoán tất cả các hướng tương đương khi chỉ có một hướng được ghép nối với mỗi hình ảnh trong quá trình đào tạo (như kịch bản đối với hầu hết các bộ dữ liệu ước tính tư thế). Trái ngược với hầu hết các bộ dữ liệu ước tính đặt ra, bộ đầy đủ các định hướng tương đương có sẵn để đánh giá.

Có tổng cộng tám hình dạng, mỗi hình được hiển thị từ 50.000 góc nhìn được phân phối ngẫu nhiên đồng nhất trên toàn bộ không gian xoay 3D. Năm trong số các hình dạng không có gì đặc biệt - tứ diện, hình lập phương, hình tứ diện, hình nón và hình trụ. Trong số đó, ba chất rắn Platon (tứ diện, khối lập phương, khối icosahedron) được chú thích bằng các đối xứng rời rạc 12, 24 và 60 lần của chúng, tương ứng. Hình nón và hình trụ được chú thích với sự đối xứng liên tục của chúng cách nhau 1 độ. Các đối xứng này được cung cấp để đánh giá; mục đích giám sát chỉ là một vòng quay duy nhất với mỗi hình ảnh.

Ba hình còn lại được đánh dấu bằng đặc điểm phân biệt. Có một hình tứ diện với một mặt màu đỏ, một hình trụ có một chấm nằm ngoài tâm và một hình cầu có một dấu X giới hạn bởi một dấu chấm. Cho dù có nhìn thấy đặc điểm phân biệt hay không, thì không gian của các hướng có thể được giảm bớt. Chúng tôi không cung cấp tập hợp các phép quay tương đương cho các hình dạng này.

Mỗi ví dụ bao gồm

  • hình ảnh 224x224 RGB
  • một chỉ mục hình dạng để tập dữ liệu có thể được lọc theo hình dạng.
    Các chỉ số tương ứng với:

    • 0 = tứ diện
    • 1 = khối lập phương
    • 2 = icosahedron
    • 3 = hình nón
    • 4 = hình trụ
    • 5 = tứ diện được đánh dấu
    • 6 = hình trụ được đánh dấu
    • 7 = hình cầu được đánh dấu
  • phép quay được sử dụng trong quá trình kết xuất, được biểu diễn dưới dạng ma trận xoay 3x3

  • tập hợp các phép quay tương đương đã biết theo phép đối xứng, để đánh giá.

Trong trường hợp ba hình dạng được đánh dấu, đây chỉ là phép quay hiển thị.

Tách ra Các ví dụ
'test' 40.000
'train' 360.000
  • Các tính năng:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

Hình dung

  • Trích dẫn:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}