Визуализация : Исследуйте в Know Your Data
Описание :
Набор данных CIFAR-10.1 — это новый тестовый набор для CIFAR-10. CIFAR-10.1 содержит около 2000 новых тестовых изображений, отобранных после многолетних исследований исходного набора данных CIFAR-10. Сбор данных для CIFAR-10.1 был разработан таким образом, чтобы свести к минимуму сдвиг распределения по сравнению с исходным набором данных. Мы описываем создание CIFAR-10.1 в статье «Обобщаются ли классификаторы CIFAR-10 на CIFAR-10?». Изображения в CIFAR-10.1 являются подмножеством набора данных TinyImages. В настоящее время существует две версии набора данных CIFAR-10.1: v4 и v6.
Домашняя страница : https://github.com/modestyachts/CIFAR-10.1
Исходный код :
tfds.image_classification.Cifar10_1
Версии :
-
1.1.0
(по умолчанию): нет примечаний к выпуску.
-
Автоматическое кэширование ( документация ): Да
Структура функции :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
изображение | Изображение | (32, 32, 3) | uint8 | |
этикетка | Метка класса | int64 |
Контролируемые ключи (см . документ
as_supervised
):('image', 'label')
Цитата :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (конфигурация по умолчанию)
Описание конфигурации : это первая версия нашего набора данных, на которой мы тестировали какой-либо классификатор. Как упоминалось выше, это делает набор данных v4 независимым от классификаторов, которые мы оцениваем. Цифры, указанные в основных разделах нашей статьи, используют эту версию набора данных. Он был построен из 25 лучших ключевых слов TinyImages для каждого класса, что привело к небольшому дисбалансу классов. Самая большая разница в том, что корабли составляют только 8% тестового набора вместо 10%. v4 содержит 2021 изображение.
Размер загрузки :
5.93 MiB
Размер набора данных :
4.46 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2021 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
cifar10_1/v6
Описание конфигурации : он получен из немного улучшенного распределения ключевых слов, которое точно сбалансировано по классам. Эта версия набора данных соответствует результатам в Приложении D к нашей статье. v6 содержит 2000 изображений.
Размер загрузки :
5.87 MiB
Размер набора данных :
4.40 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2000 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):