Wake_vision

وصف :

Wake Vision عبارة عن مجموعة بيانات كبيرة وعالية الجودة تضم أكثر من 6 ملايين صورة، وهو ما يتجاوز بشكل كبير حجم وتنوع مجموعات بيانات tinyML الحالية (100x). تتضمن مجموعة البيانات هذه صورًا مع تعليقات توضيحية حول ما إذا كانت كل صورة تحتوي على شخص ما. بالإضافة إلى ذلك، فهو يتضمن معيارًا شاملاً ودقيقًا لتقييم العدالة والقوة، ويغطي الجنس المدرك، والعمر المتصور، ومسافة الموضوع، وظروف الإضاءة، والصور. ملصقات Wake Vision مشتقة من تعليقات Open Image المرخصة من شركة Google LLC بموجب ترخيص CC BY 4.0. تم إدراج الصور على أنها تحتوي على ترخيص CC BY 2.0. ملاحظة من Open Images: "بينما حاولنا تحديد الصور المرخصة بموجب ترخيص Creative Commons Attribution، فإننا لا نقدم أي تعهدات أو ضمانات فيما يتعلق بحالة ترخيص كل صورة ويجب عليك التحقق من ترخيص كل صورة بنفسك."

الصفحة الرئيسية : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
كود المصدر : tfds.datasets.wake_vision.Builder
الإصدارات :
- 1.0.0 (افتراضي): الإصدار الأولي لمجموعات بيانات TensorFlow. لاحظ أن هذا يعتمد على الإصدار 2.0 من Wake Vision الموجود على Harvard Dataverse.
حجم التحميل : Unknown size
حجم مجموعة البيانات : 239.25 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :

ينقسم	أمثلة
`'test'`	55,763
`'train_large'`	5,760,428
`'train_quality'`	1,248,230
`'validation'`	18,582

هيكل الميزة :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
age_unknown	ClassLabel		int64
body_part	ClassLabel		int64
ساطع	ClassLabel		int64
مظلم	ClassLabel		int64
تصوير	ClassLabel		كثافة العمليات64
بعيد	ClassLabel		كثافة العمليات64
اسم الملف	نص		خيط
الجنس_غير معروف	ClassLabel		int64
صورة	صورة	(لا شيء، لا شيء، 3)	uint8
Medium_distance	ClassLabel		int64
middle_age	ClassLabel		int64
قريب	ClassLabel		int64
تصوير غير شخصي	ClassLabel		int64
غير شخص_غير تصوير	ClassLabel		int64
Normal_lighting	ClassLabel		كثافة العمليات64
كبار السن	ClassLabel		int64
شخص	ClassLabel		int64
person_depiction	ClassLabel		int64
في الغالب_أنثى	ClassLabel		int64
في الغالب_ذكر	ClassLabel		int64
شاب	ClassLabel		int64

المفاتيح الخاضعة للإشراف (انظر as_supervised doc ): ('image', 'person')
الشكل ( tfds.show_examples ):

التصور

أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}