paisajes urbanos

  • Descripción :

Cityscapes es un conjunto de datos que consta de diversas escenas de calles urbanas en 50 ciudades diferentes en distintas épocas del año, así como verdades básicas para varias tareas de visión, incluida la segmentación semántica, la segmentación a nivel de instancia (TODO) y la inferencia de disparidad de pares estéreo.

Para las tareas de segmentación (división predeterminada, accesible a través de 'cityscapes/semantic_segmentation'), Cityscapes proporciona anotaciones densas a nivel de píxeles para 5000 imágenes con una resolución de 1024 * 2048 dividida previamente en conjuntos de entrenamiento (2975), validación (500) y prueba (1525). Las anotaciones de etiquetas para las tareas de segmentación abarcan más de 30 clases que se encuentran comúnmente durante la percepción de la escena de conducción. La información detallada de la etiqueta se puede encontrar aquí: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes también proporciona anotaciones de segmentación de grano grueso (accesibles a través de 'cityscapes/semantic_segmentation_extra') para imágenes de 19998 en una división 'train_extra' que puede resultar útil para modelos de preentrenamiento/con gran cantidad de datos.

Además de la segmentación, los paisajes urbanos también proporcionan pares de imágenes estéreo y verdades básicas para tareas de inferencia de disparidad en las divisiones normal y extra (accesibles a través de 'cityscapes/stereo_disparity' y 'cityscapes/stereo_disparity_extra' respectivamente).

Ejemplos engordados:

  • Para 'paisajes urbanos/stereo_disparity_extra':
    • troisdorf_000000 000073 {*} imágenes (sin mapa de disparidad presente)
  • Documentación adicional : Explore en Papers With Code

  • Página de inicio: https://www.cityscapes-dataset.com

  • Código fuente : tfds.datasets.cityscapes.Builder

  • Versiones :

    • 1.0.0 (predeterminado): Sin notas de la versión.
  • Tamaño de descarga : Unknown size

  • Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
    Tienes que descargar archivos de https://www.cityscapes-dataset.com/login/ (Este conjunto de datos requiere registro). Para la configuración básica (semantic_segmentation) debe descargar 'leftImg8bit_trainvaltest.zip' y 'gtFine_trainvaltest.zip'. Otras configuraciones requieren archivos adicionales; consulte el código para obtener más detalles.

  • Almacenamiento automático en caché ( documentación ): No

  • Claves supervisadas (Ver as_supervised doc ): None

  • Figura ( tfds.show_examples ): no compatible.

  • Cita :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

paisajes urbanos/segmentación_semántica (configuración predeterminada)

  • Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos.

  • Tamaño del conjunto de datos : 10.86 GiB

  • Divisiones :

Separar Ejemplos
'test' 1,525
'train' 2,975
'validation' 500
  • Estructura de características :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
id_imagen Texto cuerda
imagen_izquierda Imagen (1024, 2048, 3) uint8
etiqueta_segmentación Imagen (1024, 2048, 1) uint8

paisajes urbanos/semantic_segmentation_extra

  • Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos con etiquetas gruesas y divididas train_extra.

  • Tamaño del conjunto de datos : 51.92 GiB

  • Divisiones :

Separar Ejemplos
'train' 2,975
'train_extra' 19,998
'validation' 500
  • Estructura de características :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
id_imagen Texto cuerda
imagen_izquierda Imagen (1024, 2048, 3) uint8
etiqueta_segmentación Imagen (1024, 2048, 1) uint8

paisajes urbanos/stereo_disparity

  • Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad.

  • Tamaño del conjunto de datos : 25.03 GiB

  • Divisiones :

Separar Ejemplos
'test' 1,525
'train' 2,975
'validation' 500
  • Estructura de características :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
disparity_map Imagen (1024, 2048, 1) uint8
id_imagen Texto cuerda
imagen_izquierda Imagen (1024, 2048, 3) uint8
imagen_derecha Imagen (1024, 2048, 3) uint8

paisajes urbanos/stereo_disparity_extra

  • Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad con división train_extra.

  • Tamaño del conjunto de datos : 119.18 GiB

  • Divisiones :

Separar Ejemplos
'train' 2,975
'train_extra' 19,997
'validation' 500
  • Estructura de características :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
disparity_map Imagen (1024, 2048, 1) uint8
id_imagen Texto cuerda
imagen_izquierda Imagen (1024, 2048, 3) uint8
imagen_derecha Imagen (1024, 2048, 3) uint8