mèo con

  • Sự miêu tả :

Kitti chứa một bộ nhiệm vụ tầm nhìn được xây dựng bằng nền tảng lái xe tự động. Điểm chuẩn đầy đủ chứa nhiều tác vụ như âm thanh nổi, luồng quang, phép đo hình ảnh trực quan, v.v. Tập dữ liệu này chứa tập dữ liệu phát hiện đối tượng, bao gồm các hình ảnh một mắt và hộp giới hạn. Bộ dữ liệu chứa 7481 hình ảnh đào tạo được chú thích bằng các hộp giới hạn 3D. Bạn có thể tìm thấy mô tả đầy đủ về các chú thích trong phần readme của bộ công cụ phát triển đối tượng readme trên trang chủ Kitti.

Tách ra Ví dụ
'test' 711
'train' 6.347
'validation' 423
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không, 3) uint8
hình ảnh/tên_tệp Chữ sợi dây
các đối tượng Sự liên tiếp
đối tượng/alpha Tenxơ phao32 Góc quan sát của vật thể, trong khoảng [-pi..pi]
đối tượng/hộp Tính năng BBox (4,) phao32 Hộp giới hạn 2D của đối tượng trong ảnh
đối tượng/kích thước Tenxơ (3,) phao32 Kích thước đối tượng 3D: chiều cao, chiều rộng, chiều dài (tính bằng mét)
đồ vật/địa điểm Tenxơ (3,) phao32 Vị trí đối tượng 3D x,y,z theo tọa độ camera (tính bằng mét)
đồ vật/bị chặn Nhãn lớp int64 Số nguyên (0,1,2,3) biểu thị trạng thái tắc: 0 = hiển thị hoàn toàn, 1 = bị tắc một phần2 = bị tắc phần lớn, 3 = không xác định
đối tượng/xoay_y Tenxơ phao32 Xoay quanh trục Y theo tọa độ camera [-pi..pi]
đối tượng/cắt ngắn Tenxơ phao32 Nổi từ 0 (không bị cắt ngắn) đến 1 (bị cắt ngắn), trong đó bị cắt ngắn đề cập đến đối tượng rời khỏi ranh giới hình ảnh
đồ vật/loại Nhãn lớp int64 Loại đối tượng, ví dụ: 'Ô tô' hoặc 'Van'

Hình dung

  • Trích dẫn :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}