pemandangan kota

  • Deskripsi :

Cityscapes adalah kumpulan data yang terdiri dari pemandangan jalan perkotaan yang beragam di 50 kota yang berbeda pada waktu yang berbeda sepanjang tahun serta kebenaran dasar untuk beberapa tugas penglihatan termasuk segmentasi semantik, segmentasi tingkat instans (TODO), dan inferensi disparitas pasangan stereo.

Untuk tugas segmentasi (pemisahan default, dapat diakses melalui 'cityscapes/semantic_segmentation'), Cityscapes menyediakan anotasi tingkat piksel padat untuk 5000 gambar pada resolusi 1024 * 2048 yang telah dipisah menjadi set pelatihan (2975), validasi (500), dan pengujian (1525). Anotasi label untuk tugas segmentasi mencakup 30+ kelas yang biasa ditemui selama mendorong persepsi pemandangan. Informasi label terperinci dapat ditemukan di sini: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes juga menyediakan anotasi segmentasi butiran kasar (dapat diakses melalui 'cityscapes/semantic_segmentation_extra') untuk gambar 19998 dalam pemisahan 'train_extra' yang mungkin berguna untuk model prapelatihan/berat data.

Selain segmentasi, lanskap kota juga menyediakan pasangan gambar stereo dan kebenaran dasar untuk tugas inferensi disparitas pada pemisahan normal dan ekstra (masing-masing dapat diakses melalui 'cityscapes/stereo_disparity' dan 'cityscapes/stereo_disparity_extra').

Contoh tergores:

  • Untuk 'cityscapes/stereo_disparity_extra':
    • troisdorf_000000 000073 {*} gambar (tidak ada peta disparitas)
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cityscapes/semantic_segmentation (konfigurasi default)

  • Deskripsi konfigurasi : Dataset segmentasi semantik Cityscapes.

  • Ukuran dataset : 10.86 GiB

  • Perpecahan :

Membelah Contoh
'test' 1.525
'train' 2.975
'validation' 500
  • Struktur fitur :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
image_id Teks rangkaian
gambar_kiri Gambar (1024, 2048, 3) uint8
segmentasi_label Gambar (1024, 2048, 1) uint8

cityscapes/semantic_segmentation_extra

  • Deskripsi konfigurasi : Dataset segmentasi semantik Cityscapes dengan label train_extra split dan rough.

  • Ukuran dataset : 51.92 GiB

  • Perpecahan :

Membelah Contoh
'train' 2.975
'train_extra' 19.998
'validation' 500
  • Struktur fitur :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
image_id Teks rangkaian
gambar_kiri Gambar (1024, 2048, 3) uint8
segmentasi_label Gambar (1024, 2048, 1) uint8

pemandangan kota/stereo_disparity

  • Deskripsi konfigurasi : Gambar stereo Cityscapes dan set data peta perbedaan.

  • Ukuran dataset : 25.03 GiB

  • Perpecahan :

Membelah Contoh
'test' 1.525
'train' 2.975
'validation' 500
  • Struktur fitur :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
disparity_map Gambar (1024, 2048, 1) uint8
image_id Teks rangkaian
gambar_kiri Gambar (1024, 2048, 3) uint8
image_right Gambar (1024, 2048, 3) uint8

cityscapes/stereo_disparity_extra

  • Deskripsi konfigurasi : Dataset gambar stereo Cityscapes dan peta perbedaan dengan pemisahan train_extra.

  • Ukuran dataset : 119.18 GiB

  • Perpecahan :

Membelah Contoh
'train' 2.975
'train_extra' 19.997
'validation' 500
  • Struktur fitur :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
disparity_map Gambar (1024, 2048, 1) uint8
image_id Teks rangkaian
gambar_kiri Gambar (1024, 2048, 3) uint8
image_right Gambar (1024, 2048, 3) uint8