- opis :
Cityscapes to zestaw danych składający się z różnorodnych miejskich scen ulicznych w 50 różnych miastach w różnych porach roku, a także podstawowych prawd dla kilku zadań wizyjnych, w tym segmentacji semantycznej, segmentacji na poziomie instancji (TODO) i wnioskowania o rozbieżnościach par stereo.
W przypadku zadań segmentacji (domyślny podział, dostępny przez „cityscapes/semantic_segmentation”), Cityscapes zapewnia gęste adnotacje na poziomie pikseli dla 5000 obrazów w rozdzielczości 1024 * 2048, wstępnie podzielonych na zestawy treningowe (2975), walidacyjne (500) i testowe (1525). Adnotacje etykiet dla zadań segmentacji obejmują ponad 30 klas często spotykanych podczas postrzegania sceny jazdy. Szczegółowe informacje o etykiecie można znaleźć tutaj: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes zapewnia również adnotacje dotyczące segmentacji gruboziarnistej (dostępne przez „cityscapes/semantic_segmentation_extra”) dla 19998 obrazów w podziale „train_extra”, które mogą okazać się przydatne w przypadku modeli do wstępnego uczenia/obciążających dane.
Oprócz segmentacji pejzaże miejskie zapewniają również pary obrazów stereo i podstawowe prawdy do zadań wnioskowania o rozbieżnościach zarówno w podziale normalnym, jak i dodatkowym (dostępne odpowiednio przez „cityscapes/stereo_disparity” i „cityscapes/stereo_disparity_extra”).
Ingore przykłady:
- Dla „pejzaży miejskich/stereo_disparity_extra”:
- troisdorf_000000 000073 {*} obrazy (brak mapy dysproporcji)
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.cityscapes-dataset.com
Kod źródłowy :
tfds.datasets.cityscapes.BuilderWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
Unknown sizeInstrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu
download_config.manual_dir(domyślnie~/tensorflow_datasets/downloads/manual/):
Musisz pobrać pliki z https://www.cityscapes-dataset.com/login/ (Ten zestaw danych wymaga rejestracji). W przypadku podstawowej konfiguracji (semantic_segmentation) należy pobrać „leftImg8bit_trainvaltest.zip” i „gtFine_trainvaltest.zip”. Inne konfiguracje wymagają dodatkowych plików — zobacz kod, aby uzyskać więcej informacji.Automatyczne buforowanie ( dokumentacja ): Nie
Klucze nadzorowane (Zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
cityscapes/semantic_segmentation (domyślna konfiguracja)
Opis konfiguracji : zestaw danych semantycznej segmentacji pejzaży miejskich.
Rozmiar zestawu danych :
10.86 GiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 1525 |
'train' | 2975 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| identyfikator_obrazu | Tekst | strunowy | ||
| obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
| etykieta_segmentacji | Obraz | (1024, 2048, 1) | uint8 |
- Przykłady ( tfds.as_dataframe ):
cityscapes/semantic_segmentation_extra
Opis konfiguracji: zestaw danych semantycznej segmentacji pejzaży miejskich z podziałem train_extra i etykietami zgrubnymi.
Rozmiar zestawu danych :
51.92 GiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'train' | 2975 |
'train_extra' | 19 998 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| identyfikator_obrazu | Tekst | strunowy | ||
| obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
| etykieta_segmentacji | Obraz | (1024, 2048, 1) | uint8 |
- Przykłady ( tfds.as_dataframe ):
pejzaże miejskie/stereo_disparity
Opis konfiguracji : Zestaw danych obrazu stereo pejzaży miejskich i map rozbieżności.
Rozmiar zestawu danych :
25.03 GiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 1525 |
'train' | 2975 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| mapa_rozbieżności | Obraz | (1024, 2048, 1) | uint8 | |
| identyfikator_obrazu | Tekst | strunowy | ||
| obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
| image_right | Obraz | (1024, 2048, 3) | uint8 |
- Przykłady ( tfds.as_dataframe ):
pejzaże miejskie/stereo_disparity_extra
Opis konfiguracji: Zestaw danych stereofonicznych pejzaży miejskich i map rozbieżności z podziałem train_extra.
Rozmiar zestawu danych :
119.18 GiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'train' | 2975 |
'train_extra' | 19 997 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| mapa_rozbieżności | Obraz | (1024, 2048, 1) | uint8 | |
| identyfikator_obrazu | Tekst | strunowy | ||
| obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
| image_right | Obraz | (1024, 2048, 3) | uint8 |
- Przykłady ( tfds.as_dataframe ):