wide_face

  • 説明:

WIDER FACE データセットは、公開されている WIDER データセットから画像を選択した顔検出ベンチマーク データセットです。サンプル画像に示されているように、32,203 枚の画像を選択し、393,703 枚の顔にラベルを付けます。 WIDER FACE データセットは、61 のイベント クラスに基づいて編成されています。イベント クラスごとに、40%/10%/50% のデータをトレーニング、検証、およびテスト セットとしてランダムに選択します。 PASCAL VOC データセットで採用されているものと同じ評価指標を採用しています。 MALF および Caltech データセットと同様に、テスト画像のバウンディング ボックスのグラウンド トゥルースは公開しません。ユーザーは、最終的な予測ファイルを提出する必要があり、評価を進めます。

スプリット
'test' 16,097
'train' 12,880
'validation' 3,226
  • 機能構造:
FeaturesDict({
    'faces': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'blur': uint8,
        'expression': bool,
        'illumination': bool,
        'invalid': bool,
        'occlusion': uint8,
        'pose': bool,
    }),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
順序
顔/bbox BBoxFeature (4) float32
顔/ぼかしテンソルuint8
顔・表情テンソルブール
顔/イルミネーションテンソルブール
顔/無効テンソルブール
フェース/オクルージョンテンソルuint8
顔・ポーズテンソルブール
画像画像(なし、なし、3) uint8
画像/ファイル名文章ストリング

視覚化

  • 引用
@inproceedings{yang2016wider,
    Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
    Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    Title = {WIDER FACE: A Face Detection Benchmark},
    Year = {2016} }