- Descrição :
Este é um conjunto de dados de estimativa de pose, que consiste em formas 3D simétricas em que várias orientações são visualmente indistinguíveis. O desafio é prever todas as orientações equivalentes quando apenas uma orientação é emparelhada com cada imagem durante o treinamento (como é o cenário para a maioria dos conjuntos de dados de estimativa de pose). Em contraste com a maioria dos conjuntos de dados de estimativa de pose, o conjunto completo de orientações equivalentes está disponível para avaliação.
Existem oito formas no total, cada uma renderizada a partir de 50.000 pontos de vista distribuídos uniformemente ao acaso em todo o espaço de rotações 3D. Cinco das formas são inexpressivas - tetraedro, cubo, icosaedro, cone e cilindro. Desses, os três sólidos platônicos (tetraedro, cubo, icosaedro) são anotados com suas simetrias discretas de 12, 24 e 60 vezes, respectivamente. O cone e o cilindro são anotados com suas simetrias contínuas discretizadas em intervalos de 1 grau. Essas simetrias são fornecidas para avaliação; a supervisão pretendida é apenas uma única rotação com cada imagem.
As três formas restantes são marcadas com uma característica distintiva. Há um tetraedro com uma face vermelha, um cilindro com um ponto fora do centro e uma esfera com um X encimado por um ponto. Seja o traço distintivo visível ou não, o espaço de possíveis orientações é reduzido. Não fornecemos o conjunto de rotações equivalentes para essas formas.
Cada exemplo contém de
- a imagem RGB 224x224
um índice de forma para que o conjunto de dados possa ser filtrado por forma.
Os índices correspondem a:- 0 = tetraedro
- 1 = cubo
- 2 = icosaedro
- 3 = cone
- 4 = cilindro
- 5 = tetraedro marcado
- 6 = cilindro marcado
- 7 = esfera marcada
a rotação usada no processo de renderização, representada como uma matriz de rotação 3x3
o conjunto de rotações equivalentes conhecidas sob simetria, para avaliação.
No caso das três formas marcadas, trata-se apenas da rotação de renderização.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://implicit-pdf.github.io
Código -fonte:
tfds.datasets.symmetric_solids.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
3.10 GiB
Tamanho do conjunto de dados :
3.94 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 40.000 |
'train' | 360.000 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(224, 224, 3), dtype=uint8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=8),
'rotation': Tensor(shape=(3, 3), dtype=float32),
'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=float32),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (224, 224, 3) | uint8 | |
label_shape | ClassLabel | int64 | ||
rotação | tensor | (3, 3) | float32 | |
rotações_equivalentes | tensor | (Nenhuma, 3, 3) | float32 |
Chaves supervisionadas (Consulte
as_supervised
doc ):('image', 'rotation')
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{implicitpdf2021,
title = {Implicit Representation of Probability Distributions on the Rotation
Manifold},
author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
Ramalingam, Srikumar and Makadia, Ameesh}
booktitle = {International Conference on Machine Learning}
year = {2021}
}