- Описание :
Wake Vision — это большой высококачественный набор данных, содержащий более 6 миллионов изображений, что значительно превышает масштаб и разнообразие текущих наборов данных tinyML (в 100 раз). Этот набор данных включает изображения с аннотациями о том, содержит ли каждое изображение человека. Кроме того, он включает в себя комплексный детальный критерий для оценки справедливости и надежности, охватывающий воспринимаемый пол, воспринимаемый возраст, расстояние до объекта, условия освещения и изображения. Ярлыки Wake Vision созданы на основе аннотаций Open Image, которые лицензированы Google LLC по лицензии CC BY 4.0. Изображения указаны как имеющие лицензию CC BY 2.0. Примечание от Open Images: «Хотя мы пытались идентифицировать изображения, лицензированные по лицензии Creative Commons Attribution, мы не делаем никаких заявлений и не даем гарантий относительно статуса лицензии каждого изображения, и вам следует проверить лицензию для каждого изображения самостоятельно».
Домашняя страница : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC.
Исходный код :
tfds.datasets.wake_vision.Builder
.Версии :
-
1.0.0
(по умолчанию): начальная версия наборов данных TensorFlow. Обратите внимание, что это основано на версии 2.0 Wake Vision в Harvard Dataverse.
-
Размер загрузки :
Unknown size
Размер набора данных :
239.25 GiB
Автокэширование ( документация ): Нет
Расколы :
Расколоть | Примеры |
---|---|
'test' | 55 763 |
'train_large' | 5 760 428 |
'train_quality' | 1 248 230 |
'validation' | 18 582 |
- Структура функции :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
возраст_неизвестен | Класслейбл | int64 | ||
часть_тела | Класслейбл | int64 | ||
яркий | Класслейбл | int64 | ||
темный | Класслейбл | int64 | ||
описание | Класслейбл | int64 | ||
далеко | Класслейбл | int64 | ||
имя файла | Текст | нить | ||
пол_неизвестен | Класслейбл | int64 | ||
изображение | Изображение | (Нет, Нет, 3) | uint8 | |
среднее_дистанция | Класслейбл | int64 | ||
средний_возраст | Класслейбл | int64 | ||
около | Класслейбл | int64 | ||
не-person_depiction | Класслейбл | int64 | ||
нечеловек_неизображение | Класслейбл | int64 | ||
нормальное_освещение | Класслейбл | int64 | ||
старше | Класслейбл | int64 | ||
человек | Класслейбл | int64 | ||
person_depiction | Класслейбл | int64 | ||
преимущественно_женщины | Класслейбл | int64 | ||
преимущественно_мужчины | Класслейбл | int64 | ||
молодой | Класслейбл | int64 |
Контролируемые ключи (см. документ
as_supervised
):('image', 'person')
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}