wake_vision

  • توضیحات :

Wake Vision یک مجموعه داده بزرگ و با کیفیت است که دارای بیش از 6 میلیون تصویر است که به طور قابل توجهی از مقیاس و تنوع مجموعه داده های tinyML فعلی (100x) فراتر رفته است. این مجموعه داده شامل تصاویری با حاشیه نویسی درباره اینکه آیا هر تصویر حاوی یک شخص است یا خیر است. علاوه بر این، یک معیار جامع و دقیق برای ارزیابی انصاف و استحکام، پوشش جنسیت درک شده، سن درک شده، فاصله سوژه، شرایط نوری، و تصاویر را شامل می‌شود. برچسب‌های Wake Vision برگرفته از حاشیه‌نویسی Open Image هستند که توسط Google LLC تحت مجوز CC BY 4.0 مجوز دارند. این تصاویر دارای مجوز CC BY 2.0 هستند. توجه داشته باشید که از Open Images: "در حالی که ما سعی کردیم تصاویری را که تحت مجوز Creative Commons Attribution مجوز دارند، شناسایی کنیم، ما هیچ گونه نمایندگی یا ضمانتی در مورد وضعیت مجوز هر تصویر نداریم و شما باید مجوز هر تصویر را خودتان تأیید کنید."

تقسیم کنید نمونه ها
'test' 55763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18582
  • ساختار ویژگی :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D توضیحات
FeaturesDict
سن_ناشناس ClassLabel int64
قسمت_بدن ClassLabel int64
روشن ClassLabel int64
تاریک ClassLabel int64
تصویرسازی ClassLabel int64
دور ClassLabel int64
نام فایل متن رشته
جنسیت_ناشناس ClassLabel int64
تصویر تصویر (هیچ، هیچ، 3) uint8
فاصله_متوسط ClassLabel int64
میانسالی ClassLabel int64
نزدیک ClassLabel int64
غیرشخصی_تصویر ClassLabel int64
غیرشخصی_غیر تصویر ClassLabel int64
عادی_نورپردازی ClassLabel int64
مسن تر ClassLabel int64
شخص ClassLabel int64
شخص_تصویر ClassLabel int64
غالبا_زن ClassLabel int64
غالبا_مرد ClassLabel int64
جوان ClassLabel int64

تجسم

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}