cảnh quan thành phố

  • Mô tả :

Cityscapes là một bộ dữ liệu bao gồm các cảnh đường phố đô thị đa dạng trên 50 thành phố khác nhau vào các thời điểm khác nhau trong năm cũng như các thông tin cơ bản cho một số tác vụ hình ảnh bao gồm phân đoạn ngữ nghĩa, phân đoạn cấp độ phiên bản (TODO) và suy luận chênh lệch cặp âm thanh nổi.

Đối với các tác vụ phân đoạn (tách mặc định, có thể truy cập thông qua 'cityscapes/semantic_segmentation'), Cityscapes cung cấp các chú thích mức độ pixel dày đặc cho 5000 hình ảnh ở độ phân giải 1024 * 2048 được phân chia trước thành các bộ đào tạo (2975), xác thực (500) và thử nghiệm (1525). Chú thích nhãn cho các tác vụ phân đoạn trải rộng trên hơn 30 loại thường gặp trong quá trình nhận biết cảnh lái xe. Thông tin nhãn chi tiết có thể được tìm thấy ở đây: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes cũng cung cấp các chú thích phân đoạn hạt thô (có thể truy cập thông qua 'cityscapes/semantic_segmentation_extra') cho các hình ảnh năm 19998 trong phần tách 'train_extra', điều này có thể hữu ích cho các mô hình chuẩn bị trước/có nhiều dữ liệu.

Bên cạnh phân đoạn, cảnh quan thành phố cũng cung cấp các cặp hình ảnh âm thanh nổi và sự thật cơ bản cho các tác vụ suy luận chênh lệch trên cả phân tách thông thường và phân tách bổ sung (có thể truy cập qua 'cityscapes/stereo_disparity' và 'cityscapes/stereo_disparity_extra' tương ứng).

Các ví dụ đã nhập:

  • Đối với 'cityscapes/stereo_disparity_extra':
    • troisdorf_000000 000073 {*} hình ảnh (không có bản đồ chênh lệch)
  • Tài liệu bổ sung : Khám phá trên giấy tờ với mã

  • Trang chủ : https://www.cityscapes-dataset.com

  • Mã nguồn : tfds.datasets.cityscapes.Builder

  • Phiên bản :

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : Unknown size

  • Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    Bạn phải tải xuống các tệp từ https://www.cityscapes-dataset.com/login/ (Bộ dữ liệu này yêu cầu đăng ký). Đối với cấu hình cơ bản (semantic_segmentation), bạn phải tải xuống 'leftImg8bit_trainvaltest.zip' và 'gtFine_trainvaltest.zip'. Các cấu hình khác yêu cầu tệp bổ sung - vui lòng xem mã để biết thêm chi tiết.

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Các khóa được giám sát (Xem as_supervised doc ): None

  • Hình ( tfds.show_examples ): Không được hỗ trợ.

  • trích dẫn :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cảnh quan thành phố/semantic_segmentation (cấu hình mặc định)

  • Mô tả cấu hình : Bộ dữ liệu phân đoạn ngữ nghĩa Cityscapes.

  • Kích thước tập dữ liệu : 10.86 GiB

  • Chia tách :

Tách ra ví dụ
'test' 1.525
'train' 2.975
'validation' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
image_id Chữ sợi dây
image_left Hình ảnh (1024, 2048, 3) uint8
phân đoạn_nhãn Hình ảnh (1024, 2048, 1) uint8

cảnh quan thành phố/semantic_segmentation_extra

  • Mô tả cấu hình : Bộ dữ liệu phân đoạn ngữ nghĩa của Cityscapes với các nhãn thô và phân tách train_extra.

  • Kích thước tập dữ liệu : 51.92 GiB

  • Chia tách :

Tách ra ví dụ
'train' 2.975
'train_extra' 19.998
'validation' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
image_id Chữ sợi dây
image_left Hình ảnh (1024, 2048, 3) uint8
phân đoạn_nhãn Hình ảnh (1024, 2048, 1) uint8

cảnh quan thành phố/stereo_disparity

  • Mô tả cấu hình : Bộ dữ liệu bản đồ chênh lệch và hình ảnh âm thanh nổi Cityscapes.

  • Kích thước tập dữ liệu : 25.03 GiB

  • Chia tách :

Tách ra ví dụ
'test' 1.525
'train' 2.975
'validation' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
disparity_map Hình ảnh (1024, 2048, 1) uint8
image_id Chữ sợi dây
image_left Hình ảnh (1024, 2048, 3) uint8
image_right Hình ảnh (1024, 2048, 3) uint8

cảnh quan thành phố/âm thanh nổi_disparity_extra

  • Mô tả cấu hình : Bộ dữ liệu bản đồ chênh lệch và hình ảnh âm thanh nổi Cityscapes với phần tách train_extra.

  • Kích thước tập dữ liệu : 119.18 GiB

  • Chia tách :

Tách ra ví dụ
'train' 2.975
'train_extra' 19,997
'validation' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
disparity_map Hình ảnh (1024, 2048, 1) uint8
image_id Chữ sợi dây
image_left Hình ảnh (1024, 2048, 3) uint8
image_right Hình ảnh (1024, 2048, 3) uint8