wake_vision

  • คำอธิบาย :

Wake Vision เป็นชุดข้อมูลขนาดใหญ่คุณภาพสูงที่มีรูปภาพมากกว่า 6 ล้านภาพ ซึ่งเกินขนาดและความหลากหลายของชุดข้อมูล TinyML ในปัจจุบันอย่างมาก (100x) ชุดข้อมูลนี้ประกอบด้วยรูปภาพพร้อมคำอธิบายประกอบว่าแต่ละรูปภาพมีบุคคลหรือไม่ นอกจากนี้ ยังรวมเกณฑ์มาตรฐานแบบละเอียดที่ครอบคลุมเพื่อประเมินความเป็นธรรมและความทนทาน ครอบคลุมเพศที่รับรู้ อายุที่รับรู้ ระยะห่างของวัตถุ สภาพแสง และการพรรณนา ป้าย Wake Vision มาจากคำอธิบายประกอบของ Open Image ซึ่งได้รับอนุญาตจาก Google LLC ภายใต้ใบอนุญาต CC BY 4.0 รูปภาพต่างๆ ระบุว่ามีใบอนุญาต CC BY 2.0 หมายเหตุจาก Open Images: "ในขณะที่เราพยายามระบุภาพที่ได้รับอนุญาตภายใต้ใบอนุญาต Creative Commons Attribution เราไม่ได้รับรองหรือรับประกันเกี่ยวกับสถานะใบอนุญาตของแต่ละภาพ และคุณควรตรวจสอบใบอนุญาตสำหรับภาพแต่ละภาพด้วยตัวเอง"

แยก ตัวอย่าง
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
อายุ_ไม่ทราบ ClassLabel int64
body_part ClassLabel int64
สว่าง ClassLabel int64
มืด ClassLabel int64
การพรรณนา ClassLabel int64
ไกล ClassLabel int64
ชื่อไฟล์ ข้อความ เชือก
เพศ_ไม่ทราบ ClassLabel int64
ภาพ ภาพ (ไม่มี ไม่มี 3) uint8
ปานกลาง_ระยะทาง ClassLabel int64
วัยกลางคน ClassLabel int64
ใกล้ ClassLabel int64
ไม่ใช่รูปบุคคล ClassLabel int64
ไม่ใช่บุคคล_ไม่ใช่ภาพ ClassLabel int64
ปกติ_แสง ClassLabel int64
แก่กว่า ClassLabel int64
บุคคล ClassLabel int64
บุคคล_ภาพ ClassLabel int64
เด่น_หญิง ClassLabel int64
ส่วนใหญ่_ชาย ClassLabel int64
หนุ่มสาว ClassLabel int64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('image', 'person')

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • ตัวอย่าง ( tfds.as_dataframe ): หายไป

  • การอ้างอิง :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}