- Descripción :
El conjunto de datos de iNaturalist 2021 contiene un total de 10 000 especies. El conjunto de datos de entrenamiento completo contiene casi 2,7 millones de imágenes. Para que el conjunto de datos sea más accesible, también hemos creado un conjunto de datos de entrenamiento "mini" con 50 ejemplos por especie para un total de 500 000 imágenes. La división train
entrenamiento completo se superpone con la mini
división. El conjunto val contiene para cada especie 10 imágenes de validación (100K en total). Hay un total de 500 000 imágenes de prueba en la división public_test
(sin etiquetas de verdad).
Página de inicio : https://github.com/visipedia/inat_comp/tree/master/2021
Código fuente :
tfds.image_classification.i_naturalist2021.INaturalist2021
Versiones :
-
1.0.0
: Versión inicial. -
2.0.0
: Actualización: los índices de clase siguen el orden en el archivo de tren JSON. -
2.0.1
(predeterminado) : Actualización: incluya la identificación de ejemplo como se proporciona en los archivos JSON.
-
Tamaño de descarga :
316.54 GiB
Tamaño del conjunto de datos :
318.45 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Dividir | Ejemplos |
---|---|
'mini' | 500,000 |
'test' | 500,000 |
'train' | 2,686,843 |
'val' | 100,000 |
- Estructura de características :
FeaturesDict({
'file_id': Text(shape=(), dtype=string),
'id': Scalar(shape=(), dtype=int64),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10000),
'supercategory': ClassLabel(shape=(), dtype=int64, num_classes=11),
})
- Documentación de características :
Característica | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
id_archivo | Texto | cadena | ||
identificación | Escalar | int64 | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
etiqueta | Etiqueta de clase | int64 | ||
supercategoría | Etiqueta de clase | int64 |
Claves supervisadas (Ver como_documento
as_supervised
):('image', 'label')
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
\
@misc{inaturalist21,
Howpublished = {~\url{https://github.com/visipedia/inat_comp/tree/master/2021} },
Title = { {iNaturalist} 2021 competition dataset.},
Year = {2021},
key = { {iNaturalist} 2021 competition dataset},
}