Visualización : Explore en Know Your Data
Descripción :
El conjunto de datos CIFAR-10.1 es un nuevo conjunto de prueba para CIFAR-10. CIFAR-10.1 contiene aproximadamente 2000 nuevas imágenes de prueba que fueron muestreadas después de varios años de investigación en el conjunto de datos CIFAR-10 original. La recopilación de datos para CIFAR-10.1 se diseñó para minimizar el cambio de distribución en relación con el conjunto de datos original. Describimos la creación de CIFAR-10.1 en el documento "¿Los clasificadores de CIFAR-10 se generalizan a CIFAR-10?". Las imágenes en CIFAR-10.1 son un subconjunto del conjunto de datos de TinyImages. Actualmente hay dos versiones del conjunto de datos CIFAR-10.1: v4 y v6.
Página de inicio: https://github.com/modestyachts/CIFAR-10.1
Código fuente :
tfds.image_classification.Cifar10_1
Versiones :
-
1.1.0
(predeterminado): Sin notas de la versión.
-
Almacenamiento automático en caché ( documentación ): Sí
Estructura de características :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
imagen | Imagen | (32, 32, 3) | uint8 | |
etiqueta | Etiqueta de clase | int64 |
Claves supervisadas (Ver
as_supervised
):('image', 'label')
Cita :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (configuración predeterminada)
Descripción de la configuración : es la primera versión de nuestro conjunto de datos en la que probamos cualquier clasificador. Como se mencionó anteriormente, esto hace que el conjunto de datos v4 sea independiente de los clasificadores que evaluamos. Los números informados en las secciones principales de nuestro documento utilizan esta versión del conjunto de datos. Se creó a partir de las 25 palabras clave principales de TinyImages para cada clase, lo que condujo a un ligero desequilibrio de clase. La mayor diferencia es que los barcos representan solo el 8% del conjunto de prueba en lugar del 10%. v4 contiene 2021 imágenes.
Tamaño de la descarga :
5.93 MiB
Tamaño del conjunto de datos :
4.46 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,021 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
cifrar10_1/v6
Descripción de la configuración : se deriva de una asignación de palabras clave ligeramente mejorada que está exactamente equilibrada por clase. Esta versión del conjunto de datos corresponde a los resultados del Apéndice D de nuestro artículo. v6 contiene 2000 imágenes.
Tamaño de la descarga :
5.87 MiB
Tamaño del conjunto de datos :
4.40 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):