paisagens urbanas

  • Descrição :

Cityscapes é um conjunto de dados que consiste em diversas cenas de ruas urbanas em 50 cidades diferentes em diferentes épocas do ano, bem como informações básicas para várias tarefas de visão, incluindo segmentação semântica, segmentação de nível de instância (TODO) e inferência de disparidade de par estéreo.

Para tarefas de segmentação (divisão padrão, acessível via 'cityscapes/segmentation_semantic'), Cityscapes fornece anotações densas em nível de pixel para 5000 imagens com resolução de 1024 * 2048 pré-dividida em conjuntos de treinamento (2975), validação (500) e teste (1525). As anotações de rótulos para tarefas de segmentação abrangem mais de 30 classes comumente encontradas durante a percepção da cena de direção. Informações detalhadas sobre rótulos podem ser encontradas aqui: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes também fornece anotações de segmentação de grão grosso (acessíveis via 'cityscapes/semantic_segmentation_extra') para 19.998 imagens em uma divisão 'train_extra' que pode ser útil para modelos de pré-treinamento / dados pesados.

Além da segmentação, cityscapes também fornece pares de imagens estéreo e verdades básicas para tarefas de inferência de disparidade nas divisões normal e extra (acessíveis via 'cityscapes/stereo_disparity' e 'cityscapes/stereo_disparity_extra', respectivamente).

Exemplos ingorados:

  • Para 'cityscapes/stereo_disparity_extra':
    • troisdorf_000000 000073 {*} imagens (sem mapa de disparidade presente)
  • Documentação Adicional : Explore em Papers With Code

  • Página inicial : https://www.cityscapes-dataset.com

  • Código -fonte: tfds.datasets.cityscapes.Builder

  • Versões :

    • 1.0.0 (padrão): sem notas de versão.
  • Tamanho do download : Unknown size

  • Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    Você deve baixar os arquivos de https://www.cityscapes-dataset.com/login/ (este conjunto de dados requer registro). Para configuração básica (semantic_segmentation) você deve baixar 'leftImg8bit_trainvaltest.zip' e 'gtFine_trainvaltest.zip'. Outras configurações requerem arquivos adicionais - consulte o código para obter mais detalhes.

  • Armazenado em cache automaticamente ( documentação ): Não

  • Chaves supervisionadas (Consulte as_supervised doc ): None

  • Figura ( tfds.show_examples ): Não suportado.

  • Citação :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cityscapes/semantic_segmentation (configuração padrão)

  • Descrição da configuração : Conjunto de dados de segmentação semântica de paisagens urbanas.

  • Tamanho do conjunto de dados : 10.86 GiB

  • Divisões :

Dividir Exemplos
'test' 1.525
'train' 2.975
'validation' 500
  • Estrutura de recursos :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
image_id Texto corda
image_left Imagem (1024, 2048, 3) uint8
segmentation_label Imagem (1024, 2048, 1) uint8

paisagens urbanas/semantic_segmentation_extra

  • Descrição da configuração : conjunto de dados de segmentação semântica de paisagens urbanas com divisão train_extra e rótulos grosseiros.

  • Tamanho do conjunto de dados : 51.92 GiB

  • Divisões :

Dividir Exemplos
'train' 2.975
'train_extra' 19.998
'validation' 500
  • Estrutura de recursos :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
image_id Texto corda
image_left Imagem (1024, 2048, 3) uint8
segmentation_label Imagem (1024, 2048, 1) uint8

paisagens urbanas/stereo_disparity

  • Descrição da configuração : Conjunto de dados de imagens estéreo de paisagens urbanas e mapas de disparidade.

  • Tamanho do conjunto de dados : 25.03 GiB

  • Divisões :

Dividir Exemplos
'test' 1.525
'train' 2.975
'validation' 500
  • Estrutura de recursos :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
disparity_map Imagem (1024, 2048, 1) uint8
image_id Texto corda
image_left Imagem (1024, 2048, 3) uint8
image_right Imagem (1024, 2048, 3) uint8

paisagens urbanas/stereo_disparity_extra

  • Descrição da configuração : Conjunto de dados de imagens estéreo de paisagens urbanas e mapas de disparidade com divisão train_extra.

  • Tamanho do conjunto de dados : 119.18 GiB

  • Divisões :

Dividir Exemplos
'train' 2.975
'train_extra' 19.997
'validation' 500
  • Estrutura de recursos :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
disparity_map Imagem (1024, 2048, 1) uint8
image_id Texto corda
image_left Imagem (1024, 2048, 3) uint8
image_right Imagem (1024, 2048, 3) uint8