wake_vision

توضیحات :

Wake Vision یک مجموعه داده بزرگ و با کیفیت است که دارای بیش از 6 میلیون تصویر است که به طور قابل توجهی از مقیاس و تنوع مجموعه داده های tinyML فعلی (100x) فراتر رفته است. این مجموعه داده شامل تصاویری با حاشیه نویسی درباره اینکه آیا هر تصویر حاوی یک شخص است یا خیر است. علاوه بر این، یک معیار جامع و دقیق برای ارزیابی انصاف و استحکام، پوشش جنسیت درک شده، سن درک شده، فاصله سوژه، شرایط نوری، و تصاویر را شامل می‌شود. برچسب‌های Wake Vision برگرفته از حاشیه‌نویسی Open Image هستند که توسط Google LLC تحت مجوز CC BY 4.0 مجوز دارند. این تصاویر دارای مجوز CC BY 2.0 هستند. توجه داشته باشید که از Open Images: "در حالی که ما سعی کردیم تصاویری را که تحت مجوز Creative Commons Attribution مجوز دارند، شناسایی کنیم، ما هیچ گونه نمایندگی یا ضمانتی در مورد وضعیت مجوز هر تصویر نداریم و شما باید مجوز هر تصویر را خودتان تأیید کنید."

صفحه اصلی : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
کد منبع : tfds.datasets.wake_vision.Builder
نسخه ها :
- 1.0.0 (پیش‌فرض): انتشار اولیه مجموعه داده‌های TensorFlow. توجه داشته باشید که این بر اساس نسخه 2.0 Wake Vision در Harvard Dataverse است.
اندازه دانلود : Unknown size
حجم مجموعه داده : 239.25 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

تقسیم کنید	نمونه ها
`'test'`	55763
`'train_large'`	5,760,428
`'train_quality'`	1,248,230
`'validation'`	18582

ساختار ویژگی :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
سن_ناشناس	ClassLabel		int64
قسمت_بدن	ClassLabel		int64
روشن	ClassLabel		int64
تاریک	ClassLabel		int64
تصویرسازی	ClassLabel		int64
دور	ClassLabel		int64
نام فایل	متن		رشته
جنسیت_ناشناس	ClassLabel		int64
تصویر	تصویر	(هیچ، هیچ، 3)	uint8
فاصله_متوسط	ClassLabel		int64
میانسالی	ClassLabel		int64
نزدیک	ClassLabel		int64
غیرشخصی_تصویر	ClassLabel		int64
غیرشخصی_عدم تصویر	ClassLabel		int64
عادی_نورپردازی	ClassLabel		int64
مسن تر	ClassLabel		int64
شخص	ClassLabel		int64
شخص_تصویر	ClassLabel		int64
عمدتا_زنانه	ClassLabel		int64
غالبا_مرد	ClassLabel		int64
جوان	ClassLabel		int64

کلیدهای نظارت شده (به as_supervised مراجعه کنید): ('image', 'person')
شکل ( tfds.show_examples ):

تجسم

مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}

wake_vision با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

wake_vision