cảnh quan thành phố

  • Mô tả:

Cảnh quan thành phố là một tập dữ liệu bao gồm các cảnh đường phố đô thị đa dạng trên 50 thành phố khác nhau vào các thời điểm khác nhau trong năm cũng như sự thật cơ bản cho một số nhiệm vụ tầm nhìn bao gồm phân đoạn ngữ nghĩa, phân đoạn cấp độ phiên bản (TODO) và suy luận chênh lệch cặp âm thanh nổi.

Đối với các tác vụ phân đoạn (phân chia mặc định, có thể truy cập thông qua 'cityscapes / semantic_segmentation'), Cityscapes cung cấp chú thích mức pixel dày đặc cho 5000 hình ảnh ở độ phân giải 1024 * 2048 được phân tách trước thành các bộ đào tạo (2975), xác thực (500) và kiểm tra (1525). Chú thích nhãn cho các nhiệm vụ phân đoạn trải dài trên hơn 30 lớp thường gặp trong quá trình cảm nhận cảnh lái xe. Thông tin nhãn chi tiết có thể được tìm thấy ở đây: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes cũng cung cấp các chú thích phân đoạn hạt thô (có thể truy cập thông qua 'cityscapes / semantic_segmentation_extra') cho 19998 hình ảnh trong phần tách 'train_extra' có thể hữu ích cho việc đào trước / mô hình nhiều dữ liệu.

Bên cạnh phân đoạn, cityscapes cũng cung cấp các cặp hình ảnh âm thanh nổi và chân lý nền cho các tác vụ suy luận chênh lệch trên cả phân tách bình thường và phân tách bổ sung (có thể truy cập thông qua 'cityscapes / stereo_disparity' và 'cityscapes / stereo_disparity_extra' tương ứng).

Các ví dụ đã nhập:

  • Đối với 'cityscapes / stereo_disparity_extra':
    • troisdorf_000000 000.073 {*} hình ảnh (không có bản đồ chênh lệch hiện tại)
  • Trang chủ: https://www.cityscapes-dataset.com

  • Source code: tfds.image.Cityscapes

  • phiên bản:

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Dung lượng tải về: Unknown size

  • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    Bạn cần phải download file từ https://www.cityscapes-dataset.com/login/ (Bộ dữ liệu này yêu cầu đăng ký). Đối với cấu hình cơ bản (semantic_segmentation), bạn phải tải xuống 'leftImg8bit_trainvaltest.zip' và 'gtFine_trainvaltest.zip'. Các cấu hình khác yêu cầu tệp bổ sung - vui lòng xem mã để biết thêm chi tiết.

  • Tự động lưu trữ ( tài liệu ): Không

  • Phím giám sát (Xem as_supervised doc ): None

  • Hình ( tfds.show_examples ): Không được hỗ trợ.

  • Trích dẫn:

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cityscapes / semantic_segmentation (cấu hình mặc định)

  • Config mô tả: cityscapes Phân khúc ngữ nghĩa dữ liệu.

  • Kích thước tập dữ liệu: 10.86 GiB

  • tách:

Tách ra Các ví dụ
'test' 1.525
'train' 2.975
'validation' 500
  • Các tính năng:
FeaturesDict({
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
})

cityscapes / semantic_segmentation_extra

  • Config mô tả: cityscapes ngữ nghĩa phân bộ dữ liệu với chia train_extra và nhãn thô.

  • Kích thước tập dữ liệu: 51.92 GiB

  • tách:

Tách ra Các ví dụ
'train' 2.975
'train_extra' 19.998
'validation' 500
  • Các tính năng:
FeaturesDict({
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
})

cityscapes / stereo_disparity

  • Config mô tả: hình ảnh stereo cityscapes và chênh lệch bản đồ tập dữ liệu.

  • Kích thước tập dữ liệu: 25.03 GiB

  • tách:

Tách ra Các ví dụ
'test' 1.525
'train' 2.975
'validation' 500
  • Các tính năng:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
})

cityscapes / stereo_disparity_extra

  • Config mô tả: hình ảnh stereo cityscapes và chênh lệch bản đồ bộ dữ liệu với train_extra chia.

  • Kích thước tập dữ liệu: 119.18 GiB

  • tách:

Tách ra Các ví dụ
'train' 2.975
'train_extra' 19.997
'validation' 500
  • Các tính năng:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
})