- Sự miêu tả :
Kitti chứa một bộ nhiệm vụ tầm nhìn được xây dựng bằng nền tảng lái xe tự động. Điểm chuẩn đầy đủ chứa nhiều tác vụ như âm thanh nổi, luồng quang, phép đo hình ảnh trực quan, v.v. Tập dữ liệu này chứa tập dữ liệu phát hiện đối tượng, bao gồm các hình ảnh một mắt và hộp giới hạn. Bộ dữ liệu chứa 7481 hình ảnh đào tạo được chú thích bằng các hộp giới hạn 3D. Bạn có thể tìm thấy mô tả đầy đủ về các chú thích trong phần readme của bộ công cụ phát triển đối tượng readme trên trang chủ Kitti.
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : http://www.cvlibs.net/datasets/kitti/
Mã nguồn :
tfds.datasets.kitti.Builder
Phiên bản :
-
3.1.0
: Không có ghi chú phát hành. -
3.2.0
: Devkit được cập nhật. -
3.3.0
(mặc định): Đã thêm nhãn cho tính năngoccluded
.
-
Kích thước tải xuống :
11.71 GiB
Kích thước tập dữ liệu :
5.27 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 711 |
'train' | 6.347 |
'validation' | 423 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (Không, Không, 3) | uint8 | |
hình ảnh/tên_tệp | Chữ | sợi dây | ||
đồ vật | Sự liên tiếp | |||
đối tượng/alpha | Tenxơ | phao32 | Góc quan sát của vật thể, trong khoảng [-pi..pi] | |
đối tượng/hộp | Tính năng BBox | (4,) | phao32 | Hộp giới hạn 2D của đối tượng trong ảnh |
đối tượng/kích thước | Tenxơ | (3,) | phao32 | Kích thước đối tượng 3D: chiều cao, chiều rộng, chiều dài (tính bằng mét) |
đồ vật/địa điểm | Tenxơ | (3,) | phao32 | Vị trí đối tượng 3D x,y,z theo tọa độ camera (tính bằng mét) |
đồ vật/bị chặn | Nhãn lớp | int64 | Số nguyên (0,1,2,3) biểu thị trạng thái tắc: 0 = hiển thị hoàn toàn, 1 = bị tắc một phần2 = bị tắc phần lớn, 3 = không xác định | |
đối tượng/xoay_y | Tenxơ | phao32 | Xoay quanh trục Y theo tọa độ camera [-pi..pi] | |
đối tượng/cắt ngắn | Tenxơ | phao32 | Nổi từ 0 (không bị cắt ngắn) đến 1 (bị cắt ngắn), trong đó bị cắt ngắn đề cập đến đối tượng rời khỏi ranh giới hình ảnh | |
đồ vật/loại | Nhãn lớp | int64 | Loại đối tượng, ví dụ: 'Ô tô' hoặc 'Van' |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}