- Descripción :
Este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge, correspondiente a las competencias de Clasificación y Detección.
En la competencia de Clasificación, el objetivo es predecir el conjunto de etiquetas contenidas en la imagen, mientras que en la competencia de Detección el objetivo es predecir el cuadro delimitador y la etiqueta de cada objeto individual. ADVERTENCIA: Según el conjunto de datos oficial, el conjunto de prueba de VOC2012 no contiene anotaciones.
Documentación adicional : Explorar en artículos con código
Código fuente :
tfds.object_detection.Voc
Versiones :
-
5.0.0
(predeterminado) : sin notas de versión.
-
Almacenamiento en caché automático ( documentación ): No
Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
imagen/nombre de archivo | Texto | cadena | ||
etiquetas | Secuencia (etiqueta de clase) | (Ninguno,) | int64 | |
etiquetas_no_difíciles | Secuencia (etiqueta de clase) | (Ninguno,) | int64 | |
objetos | Secuencia | |||
objetos/caja | Característica BBox | (4,) | flotador32 | |
objetos/es_difícil | Tensor | booleano | ||
objetos/está_truncado | Tensor | booleano | ||
objetos/etiqueta | Etiqueta de clase | int64 | ||
objetos/pose | Etiqueta de clase | int64 |
- Claves supervisadas (ver documento
as_supervised
):None
voc/2007 (configuración predeterminada)
- Descripción de la configuración : este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge 2007, también conocido como VOC2007.
En este conjunto de datos se incluyen un total de 9963 imágenes, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 24640 objetos anotados.
Página de inicio : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Tamaño de descarga :
868.85 MiB
Tamaño del conjunto de datos :
837.73 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2,510 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Descripción de la configuración : este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge 2012, también conocido como VOC2012.
En este conjunto de datos se incluyen un total de 11540 imágenes, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 27450 objetos anotados.
Página de inicio : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
2.44 GiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 10,991 |
'train' | 5.717 |
'validation' | 5.823 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}