open_images_challenge2019_detection

Open Images es un lanzamiento colaborativo de aproximadamente 9 millones de imágenes anotadas con etiquetas de nivel de imagen, cuadros delimitadores de objetos, máscaras de segmentación de objetos y relaciones visuales. Este conjunto de datos excepcionalmente grande y diverso está diseñado para impulsar avances de última generación en el análisis y la comprensión de imágenes.

Contiene los datos de la pista de detección de objetos de la competencia. El objetivo de esta pista es predecir un cuadro delimitador estrecho alrededor de todas las instancias de objetos de 500 clases.

Las imágenes se anotan con etiquetas de nivel de imagen positivas, lo que indica que ciertas clases de objetos están presentes, y con etiquetas de nivel de imagen negativas, lo que indica que ciertas clases están ausentes. En la competencia, todas las demás clases no anotadas están excluidas de la evaluación en esa imagen. Para cada etiqueta de nivel de imagen positiva en una imagen, se anotó cada instancia de esa clase de objeto en la imagen.

Separar Ejemplos
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • Estructura de características :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
bobjetos Secuencia
bobjetos/bbox BBoxCaracterística (4,) flotar32
bobjects/es_grupo_de Tensor bool
bobjetos/etiqueta Etiqueta de clase int64
identificación Texto cuerda
imagen Imagen (Ninguno, Ninguno, 3) uint8
objetos Secuencia
objetos/confianza Tensor flotar32
objetos/etiqueta Etiqueta de clase int64
objetos/fuente Texto cuerda

open_images_challenge2019_detection/200k (configuración predeterminada)

  • Descripción de la configuración : las imágenes tienen como máximo 200 000 píxeles, con una calidad de 72 JPEG.

  • Tamaño del conjunto de datos : 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualización

open_images_challenge2019_detection/300k

  • Descripción de la configuración : las imágenes tienen como máximo 300 000 píxeles, con una calidad de 72 JPEG.

  • Tamaño del conjunto de datos : 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualización