face_larga

  • Descrição :

O conjunto de dados WIDER FACE é um conjunto de dados de benchmark de detecção facial, do qual as imagens são selecionadas do conjunto de dados WIDER disponível publicamente. Escolhemos 32.203 imagens e rotulamos 393.703 rostos com alto grau de variabilidade em escala, pose e oclusão conforme representado nas imagens de amostra. O conjunto de dados WIDER FACE é organizado com base em 61 classes de eventos. Para cada classe de evento, selecionamos aleatoriamente 40%/10%/50% dos dados como conjuntos de treinamento, validação e teste. Adotamos a mesma métrica de avaliação empregada no conjunto de dados PASCAL VOC. Semelhante aos conjuntos de dados MALF e Caltech, não divulgamos a verdade da caixa delimitadora para as imagens de teste. Os usuários são obrigados a enviar arquivos de previsão finais, que iremos avaliar.

Dividir Exemplos
'test' 16.097
'train' 12.880
'validation' 3.226
  • Estrutura de recursos :
FeaturesDict({
    'faces': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'blur': uint8,
        'expression': bool,
        'illumination': bool,
        'invalid': bool,
        'occlusion': uint8,
        'pose': bool,
    }),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
rostos Seqüência
faces/bbox Recurso BBox (4,) float32
rostos/borrão tensor uint8
faces/expressão tensor bool
rostos/iluminação tensor bool
faces/inválido tensor bool
faces/oclusão tensor uint8
rostos/pose tensor bool
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
imagem/nome do arquivo Texto corda

Visualização

  • Citação :
@inproceedings{yang2016wider,
    Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
    Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    Title = {WIDER FACE: A Face Detection Benchmark},
    Year = {2016} }