- 설명 :
WIDER FACE 데이터세트는 공개적으로 사용 가능한 WIDER 데이터세트에서 이미지를 선택하는 얼굴 감지 벤치마크 데이터세트입니다. 샘플 이미지에 표시된 대로 32,203개의 이미지를 선택하고 393,703개의 얼굴에 스케일, 포즈 및 폐색의 높은 가변성을 표시합니다. WIDER FACE 데이터셋은 61개의 이벤트 클래스를 기반으로 구성되었습니다. 각 이벤트 클래스에 대해 학습, 검증 및 테스트 세트로 40%/10%/50% 데이터를 무작위로 선택합니다. 우리는 PASCAL VOC 데이터 세트에서 사용된 것과 동일한 평가 메트릭을 채택합니다. MALF 및 Caltech 데이터 세트와 유사하게 테스트 이미지에 대한 경계 상자 정답을 공개하지 않습니다. 사용자는 최종 예측 파일을 제출해야 하며 평가를 진행합니다.
소스 코드 :
tfds.object_detection.WiderFace
버전 :
-
0.1.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
3.42 GiB
데이터세트 크기 :
Unknown size
자동 캐시 ( 문서 ): 알 수 없음
분할 :
나뉘다 | 예 |
---|---|
'test' | 16,097 |
'train' | 12,880 |
'validation' | 3,226 |
- 기능 구조 :
FeaturesDict({
'faces': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
'blur': tf.uint8,
'expression': tf.bool,
'illumination': tf.bool,
'invalid': tf.bool,
'occlusion': tf.uint8,
'pose': tf.bool,
}),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/filename': Text(shape=(), dtype=tf.string),
})
- 기능 문서 :
특징 | 수업 | 모양 | 디타입 | 설명 |
---|---|---|---|---|
기능사전 | ||||
얼굴들 | 순서 | |||
얼굴/bbox | BBox기능 | (4,) | tf.float32 | |
얼굴/흐림 | 텐서 | tf.uint8 | ||
얼굴/표정 | 텐서 | tf.bool | ||
얼굴/조명 | 텐서 | tf.bool | ||
얼굴/잘못된 | 텐서 | tf.bool | ||
얼굴/교합 | 텐서 | tf.uint8 | ||
얼굴/포즈 | 텐서 | tf.bool | ||
영상 | 영상 | (없음, 없음, 3) | tf.uint8 | |
이미지/파일명 | 텍스트 | tf.string |
감독 대상 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{yang2016wider,
Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
Title = {WIDER FACE: A Face Detection Benchmark},
Year = {2016} }