bangun_visi

  • Keterangan :

Wake Vision adalah kumpulan data besar dan berkualitas tinggi yang menampilkan lebih dari 6 juta gambar, jauh melebihi skala dan keragaman kumpulan data tinyML saat ini (100x). Kumpulan data ini mencakup gambar dengan anotasi apakah setiap gambar berisi seseorang. Selain itu, ini juga mencakup tolok ukur terperinci yang komprehensif untuk menilai keadilan dan kekokohan, yang mencakup persepsi gender, persepsi usia, jarak subjek, kondisi pencahayaan, dan penggambaran. Label Wake Vision berasal dari anotasi Open Image yang dilisensikan oleh Google LLC di bawah lisensi CC BY 4.0. Gambar-gambar tersebut terdaftar memiliki lisensi CC BY 2.0. Catatan dari Open Images: "meskipun kami mencoba mengidentifikasi gambar yang dilisensikan di bawah lisensi Creative Commons Attribution, kami tidak membuat pernyataan atau jaminan mengenai status lisensi setiap gambar dan Anda harus memverifikasi sendiri lisensi untuk setiap gambar."

Membelah Contoh
'test' 55.763
'train_large' 5.760.428
'train_quality' 1.248.230
'validation' 18.582
  • Struktur fitur :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
usia_tidak diketahui Label Kelas int64
bagian_tubuh Label Kelas int64
terang Label Kelas int64
gelap Label Kelas int64
penggambaran Label Kelas int64
jauh Label Kelas int64
nama file Teks rangkaian
gender_tidak diketahui Label Kelas int64
gambar Gambar (Tidak ada, Tidak ada, 3) uint8
jarak_sedang Label Kelas int64
usia_tengah Label Kelas int64
di dekat Label Kelas int64
penggambaran_non-orang Label Kelas int64
non-orang_non-penggambaran Label Kelas int64
pencahayaan_normal Label Kelas int64
lebih tua Label Kelas int64
orang Label Kelas int64
orang_penggambaran Label Kelas int64
didominasi_perempuan Label Kelas int64
didominasi_laki-laki Label Kelas int64
muda Label Kelas int64

Visualisasi

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}