- توضیحات :
Wake Vision یک مجموعه داده بزرگ و با کیفیت است که دارای بیش از 6 میلیون تصویر است که به طور قابل توجهی از مقیاس و تنوع مجموعه داده های tinyML فعلی (100x) فراتر رفته است. این مجموعه داده شامل تصاویری با حاشیه نویسی درباره اینکه آیا هر تصویر حاوی یک شخص است یا خیر است. علاوه بر این، یک معیار جامع و دقیق برای ارزیابی انصاف و استحکام، پوشش جنسیت درک شده، سن درک شده، فاصله سوژه، شرایط نوری، و تصاویر را شامل میشود. برچسبهای Wake Vision برگرفته از حاشیهنویسی Open Image هستند که توسط Google LLC تحت مجوز CC BY 4.0 مجوز دارند. این تصاویر دارای مجوز CC BY 2.0 هستند. توجه داشته باشید که از Open Images: "در حالی که ما سعی کردیم تصاویری را که تحت مجوز Creative Commons Attribution مجوز دارند، شناسایی کنیم، ما هیچ گونه نمایندگی یا ضمانتی در مورد وضعیت مجوز هر تصویر نداریم و شما باید مجوز هر تصویر را خودتان تأیید کنید."
صفحه اصلی : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
کد منبع :
tfds.datasets.wake_vision.Builder
نسخه ها :
-
1.0.0
(پیشفرض): انتشار اولیه مجموعه دادههای TensorFlow. توجه داشته باشید که این بر اساس نسخه 2.0 Wake Vision در Harvard Dataverse است.
-
اندازه دانلود :
Unknown size
حجم مجموعه داده :
239.25 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'test' | 55763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18582 |
- ساختار ویژگی :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | توضیحات |
---|---|---|---|---|
FeaturesDict | ||||
سن_ناشناس | ClassLabel | int64 | ||
قسمت_بدن | ClassLabel | int64 | ||
روشن | ClassLabel | int64 | ||
تاریک | ClassLabel | int64 | ||
تصویرسازی | ClassLabel | int64 | ||
دور | ClassLabel | int64 | ||
نام فایل | متن | رشته | ||
جنسیت_ناشناس | ClassLabel | int64 | ||
تصویر | تصویر | (هیچ، هیچ، 3) | uint8 | |
فاصله_متوسط | ClassLabel | int64 | ||
میانسالی | ClassLabel | int64 | ||
نزدیک | ClassLabel | int64 | ||
غیرشخصی_تصویر | ClassLabel | int64 | ||
غیرشخصی_عدم تصویر | ClassLabel | int64 | ||
عادی_نورپردازی | ClassLabel | int64 | ||
مسن تر | ClassLabel | int64 | ||
شخص | ClassLabel | int64 | ||
شخص_تصویر | ClassLabel | int64 | ||
عمدتا_زنانه | ClassLabel | int64 | ||
غالبا_مرد | ClassLabel | int64 | ||
جوان | ClassLabel | int64 |
کلیدهای نظارت شده (به
as_supervised
مراجعه کنید):('image', 'person')
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}