더 넓은 얼굴

  • 설명 :

WIDER FACE 데이터세트는 공개적으로 사용 가능한 WIDER 데이터세트에서 이미지를 선택하는 얼굴 감지 벤치마크 데이터세트입니다. 샘플 이미지에 표시된 대로 32,203개의 이미지를 선택하고 393,703개의 얼굴에 스케일, 포즈 및 폐색의 높은 가변성을 표시합니다. WIDER FACE 데이터셋은 61개의 이벤트 클래스를 기반으로 구성되었습니다. 각 이벤트 클래스에 대해 학습, 검증 및 테스트 세트로 40%/10%/50% 데이터를 무작위로 선택합니다. 우리는 PASCAL VOC 데이터 세트에서 사용된 것과 동일한 평가 메트릭을 채택합니다. MALF 및 Caltech 데이터 세트와 유사하게 테스트 이미지에 대한 경계 상자 정답을 공개하지 않습니다. 사용자는 최종 예측 파일을 제출해야 하며 평가를 진행합니다.

나뉘다
'test' 16,097
'train' 12,880
'validation' 3,226
  • 기능 구조 :
FeaturesDict({
    'faces': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'blur': tf.uint8,
        'expression': tf.bool,
        'illumination': tf.bool,
        'invalid': tf.bool,
        'occlusion': tf.uint8,
        'pose': tf.bool,
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
})
  • 기능 문서 :
특징 수업 모양 디타입 설명
기능사전
얼굴들 순서
얼굴/bbox BBox기능 (4,) tf.float32
얼굴/흐림 텐서 tf.uint8
얼굴/표정 텐서 tf.bool
얼굴/조명 텐서 tf.bool
얼굴/잘못된 텐서 tf.bool
얼굴/교합 텐서 tf.uint8
얼굴/포즈 텐서 tf.bool
영상 영상 (없음, 없음, 3) tf.uint8
이미지/파일명 텍스트 tf.string

심상

  • 인용 :
@inproceedings{yang2016wider,
    Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
    Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    Title = {WIDER FACE: A Face Detection Benchmark},
    Year = {2016} }