- 説明:
WIDER FACEデータセットは顔検出ベンチマークデータセットであり、その画像は公開されているWIDERデータセットから選択されます。サンプル画像に示されているように、32,203枚の画像を選択し、スケール、ポーズ、オクルージョンのばらつきが大きい393,703枚の顔にラベルを付けます。 WIDER FACEデータセットは、61のイベントクラスに基づいて構成されています。イベントクラスごとに、トレーニング、検証、テストのセットとして40%/ 10%/ 50%のデータをランダムに選択します。 PASCALVOCデータセットで採用されているものと同じ評価指標を採用しています。 MALFおよびCaltechデータセットと同様に、テスト画像のバウンディングボックスのグラウンドトゥルースはリリースしません。ユーザーは最終的な予測ファイルを提出する必要があり、それを評価に進みます。
ホームページ: http ://shuoyang1213.me/WIDERFACE/
ソースコード:
tfds.object_detection.WiderFace
バージョン:
-
0.1.0
(デフォルト):リリースノートなし。
-
ダウンロードサイズ:
3.42 GiB
データセットサイズ:
Unknown size
自動キャッシュ(ドキュメント):不明
分割:
スプリット | 例 |
---|---|
'test' | 16,097 |
'train' | 12,880 |
'validation' | 3,226 |
- 素性構造:
FeaturesDict({
'faces': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
'blur': tf.uint8,
'expression': tf.bool,
'illumination': tf.bool,
'invalid': tf.bool,
'occlusion': tf.uint8,
'pose': tf.bool,
}),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/filename': Text(shape=(), dtype=tf.string),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
FeaturesDict | ||||
顔 | 順序 | |||
顔/bbox | BBoxFeature | (4、) | tf.float32 | |
顔/ぼかし | テンソル | tf.uint8 | ||
顔/表情 | テンソル | tf.bool | ||
顔/照明 | テンソル | tf.bool | ||
顔/無効 | テンソル | tf.bool | ||
顔/閉塞 | テンソル | tf.uint8 | ||
顔/ポーズ | テンソル | tf.bool | ||
画像 | 画像 | (なし、なし、3) | tf.uint8 | |
画像/ファイル名 | 文章 | tf.string |
監視対象キー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{yang2016wider,
Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
Title = {WIDER FACE: A Face Detection Benchmark},
Year = {2016} }