Visualização : Explorar em Conheça seus dados
Descrição :
Do jornal: coletamos automaticamente um conjunto de dados de 5.003 imagens de filmes populares de Hollywood. As imagens foram obtidas executando um detector de pessoas de última geração em cada décimo quadro de 30 filmes. As pessoas detectadas com alta confiança (aproximadamente 20 mil candidatos) foram então enviadas ao mercado de crowdsourcing Amazon Mechanical Turk para obter a rotulagem de verdade. Cada imagem foi anotada por cinco turcos por $ 0,01 cada para rotular 10 articulações da parte superior do corpo. A rotulagem mediana de cinco foi tomada em cada imagem para ser robusta à anotação atípica. Finalmente, as imagens foram rejeitadas manualmente por nós se a pessoa estivesse ocluída ou severamente não frontal. Reservamos 20% (1016 imagens) dos dados para teste.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://bensapp.github.io/flic-dataset.html
Código -fonte:
tfds.datasets.flic.Builder
Versões :
-
2.0.0
(padrão): sem notas de versão.
-
Tamanho do conjunto de dados :
317.94 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 1.016 |
'train' | 3.987 |
- Estrutura de recursos :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
currframe | tensor | float64 | ||
imagem | Imagem | (480, 720, 3) | uint8 | |
nome do filme | Texto | corda | ||
poselet_hit_idx | Sequência(Tensor) | (Nenhum,) | uint16 | |
torsobox | Recurso BBox | (4,) | float32 | |
xcoords | Sequência(Tensor) | (Nenhum,) | float64 | |
ycoords | Sequência(Tensor) | (Nenhum,) | float64 |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Citação :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configuração padrão)
Descrição da configuração : Usa 5003 exemplos usados no papel CVPR13 MODEC.
Tamanho do download :
286.35 MiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
flic/cheio
Descrição da configuração : usa 20928 exemplos, um superconjunto de FLIC que consiste em exemplos mais difíceis.
Tamanho do download :
1.10 GiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):