- وصف :
Wake Vision عبارة عن مجموعة بيانات كبيرة وعالية الجودة تضم أكثر من 6 ملايين صورة، وهو ما يتجاوز بشكل كبير حجم وتنوع مجموعات بيانات tinyML الحالية (100x). تتضمن مجموعة البيانات هذه صورًا مع تعليقات توضيحية حول ما إذا كانت كل صورة تحتوي على شخص ما. بالإضافة إلى ذلك، فهو يتضمن معيارًا شاملاً ودقيقًا لتقييم العدالة والقوة، ويغطي الجنس المدرك، والعمر المتصور، ومسافة الموضوع، وظروف الإضاءة، والصور. ملصقات Wake Vision مشتقة من تعليقات Open Image المرخصة من شركة Google LLC بموجب ترخيص CC BY 4.0. تم إدراج الصور على أنها تحتوي على ترخيص CC BY 2.0. ملاحظة من Open Images: "بينما حاولنا تحديد الصور المرخصة بموجب ترخيص Creative Commons Attribution، فإننا لا نقدم أي تعهدات أو ضمانات فيما يتعلق بحالة ترخيص كل صورة ويجب عليك التحقق من ترخيص كل صورة بنفسك."
الصفحة الرئيسية : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
كود المصدر :
tfds.datasets.wake_vision.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي لمجموعات بيانات TensorFlow. لاحظ أن هذا يعتمد على الإصدار 2.0 من Wake Vision الموجود على Harvard Dataverse.
-
حجم التحميل :
Unknown size
حجم مجموعة البيانات :
239.25 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- هيكل الميزة :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
age_unknown | ClassLabel | int64 | ||
body_part | ClassLabel | int64 | ||
ساطع | ClassLabel | int64 | ||
مظلم | ClassLabel | int64 | ||
تصوير | ClassLabel | كثافة العمليات64 | ||
بعيد | ClassLabel | كثافة العمليات64 | ||
اسم الملف | نص | خيط | ||
الجنس_غير معروف | ClassLabel | int64 | ||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
Medium_distance | ClassLabel | int64 | ||
middle_age | ClassLabel | int64 | ||
قريب | ClassLabel | int64 | ||
تصوير غير شخصي | ClassLabel | int64 | ||
غير شخص_غير تصوير | ClassLabel | int64 | ||
Normal_lighting | ClassLabel | كثافة العمليات64 | ||
كبار السن | ClassLabel | int64 | ||
شخص | ClassLabel | int64 | ||
person_depiction | ClassLabel | int64 | ||
في الغالب_أنثى | ClassLabel | int64 | ||
في الغالب_ذكر | ClassLabel | int64 | ||
شاب | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):('image', 'person')
الشكل ( tfds.show_examples ):
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}