wide_face

  • Deskripsi :

Kumpulan data WAJAH LEBIH LUAS adalah kumpulan data tolok ukur deteksi wajah, yang gambarnya dipilih dari kumpulan data LEBIH LUAS yang tersedia untuk umum. Kami memilih 32.203 gambar dan memberi label pada 393.703 wajah dengan tingkat variabilitas yang tinggi dalam skala, pose, dan oklusi seperti yang digambarkan dalam gambar sampel. Dataset WAJAH LEBIH LUAS diatur berdasarkan 61 kelas peristiwa. Untuk setiap kelas acara, kami secara acak memilih data 40%/10%/50% sebagai set pelatihan, validasi, dan pengujian. Kami mengadopsi metrik evaluasi yang sama yang digunakan dalam dataset PASCAL VOC. Serupa dengan dataset MALF dan Caltech, kami tidak merilis bounding box ground truth untuk gambar uji. Pengguna diminta untuk mengirimkan file prediksi akhir, yang akan kami evaluasi.

Membelah Contoh
'test' 16.097
'train' 12.880
'validation' 3.226
  • Struktur fitur :
FeaturesDict({
    'faces': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'blur': tf.uint8,
        'expression': tf.bool,
        'illumination': tf.bool,
        'invalid': tf.bool,
        'occlusion': tf.uint8,
        'pose': tf.bool,
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
FiturDict
wajah Urutan
wajah/bbox Fitur Kotak (4,) tf.float32
wajah/kabur Tensor tf.uint8
wajah/ekspresi Tensor tf.bool
wajah/iluminasi Tensor tf.bool
wajah/tidak valid Tensor tf.bool
wajah/oklusi Tensor tf.uint8
wajah/pose Tensor tf.bool
gambar Gambar (Tidak ada, Tidak ada, 3) tf.uint8
gambar/nama file Teks tf.string

visualisasi

  • kutipan :
@inproceedings{yang2016wider,
    Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
    Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    Title = {WIDER FACE: A Face Detection Benchmark},
    Year = {2016} }