- Descrição :
Cityscapes é um conjunto de dados que consiste em diversas cenas de ruas urbanas em 50 cidades diferentes em diferentes épocas do ano, bem como informações básicas para várias tarefas de visão, incluindo segmentação semântica, segmentação de nível de instância (TODO) e inferência de disparidade de par estéreo.
Para tarefas de segmentação (divisão padrão, acessível via 'cityscapes/segmentation_semantic'), Cityscapes fornece anotações densas em nível de pixel para 5000 imagens com resolução de 1024 * 2048 pré-dividida em conjuntos de treinamento (2975), validação (500) e teste (1525). As anotações de rótulos para tarefas de segmentação abrangem mais de 30 classes comumente encontradas durante a percepção da cena de direção. Informações detalhadas sobre rótulos podem ser encontradas aqui: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes também fornece anotações de segmentação de grão grosso (acessíveis via 'cityscapes/semantic_segmentation_extra') para 19.998 imagens em uma divisão 'train_extra' que pode ser útil para modelos de pré-treinamento / dados pesados.
Além da segmentação, cityscapes também fornece pares de imagens estéreo e verdades básicas para tarefas de inferência de disparidade nas divisões normal e extra (acessíveis via 'cityscapes/stereo_disparity' e 'cityscapes/stereo_disparity_extra', respectivamente).
Exemplos ingorados:
- Para 'cityscapes/stereo_disparity_extra':
- troisdorf_000000 000073 {*} imagens (sem mapa de disparidade presente)
Documentação Adicional : Explore em Papers With Code
Página inicial : https://www.cityscapes-dataset.com
Código -fonte:
tfds.datasets.cityscapes.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
Unknown size
Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em
download_config.manual_dir
(o padrão é~/tensorflow_datasets/downloads/manual/
):
Você deve baixar os arquivos de https://www.cityscapes-dataset.com/login/ (este conjunto de dados requer registro). Para configuração básica (semantic_segmentation) você deve baixar 'leftImg8bit_trainvaltest.zip' e 'gtFine_trainvaltest.zip'. Outras configurações requerem arquivos adicionais - consulte o código para obter mais detalhes.Armazenado em cache automaticamente ( documentação ): Não
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
cityscapes/semantic_segmentation (configuração padrão)
Descrição da configuração : Conjunto de dados de segmentação semântica de paisagens urbanas.
Tamanho do conjunto de dados :
10.86 GiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Estrutura de recursos :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
image_id | Texto | corda | ||
image_left | Imagem | (1024, 2048, 3) | uint8 | |
segmentation_label | Imagem | (1024, 2048, 1) | uint8 |
- Exemplos ( tfds.as_dataframe ):
paisagens urbanas/semantic_segmentation_extra
Descrição da configuração : conjunto de dados de segmentação semântica de paisagens urbanas com divisão train_extra e rótulos grosseiros.
Tamanho do conjunto de dados :
51.92 GiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.975 |
'train_extra' | 19.998 |
'validation' | 500 |
- Estrutura de recursos :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
image_id | Texto | corda | ||
image_left | Imagem | (1024, 2048, 3) | uint8 | |
segmentation_label | Imagem | (1024, 2048, 1) | uint8 |
- Exemplos ( tfds.as_dataframe ):
paisagens urbanas/stereo_disparity
Descrição da configuração : Conjunto de dados de imagens estéreo de paisagens urbanas e mapas de disparidade.
Tamanho do conjunto de dados :
25.03 GiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Estrutura de recursos :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
disparity_map | Imagem | (1024, 2048, 1) | uint8 | |
image_id | Texto | corda | ||
image_left | Imagem | (1024, 2048, 3) | uint8 | |
image_right | Imagem | (1024, 2048, 3) | uint8 |
- Exemplos ( tfds.as_dataframe ):
paisagens urbanas/stereo_disparity_extra
Descrição da configuração : Conjunto de dados de imagens estéreo de paisagens urbanas e mapas de disparidade com divisão train_extra.
Tamanho do conjunto de dados :
119.18 GiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.975 |
'train_extra' | 19.997 |
'validation' | 500 |
- Estrutura de recursos :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
disparity_map | Imagem | (1024, 2048, 1) | uint8 | |
image_id | Texto | corda | ||
image_left | Imagem | (1024, 2048, 3) | uint8 | |
image_right | Imagem | (1024, 2048, 3) | uint8 |
- Exemplos ( tfds.as_dataframe ):