- Keterangan :
Kitti berisi serangkaian tugas penglihatan yang dibangun menggunakan platform mengemudi otonom. Tolok ukur lengkap berisi banyak tugas seperti stereo, aliran optik, odometri visual, dll. Kumpulan data ini berisi kumpulan data deteksi objek, termasuk gambar monokuler dan kotak pembatas. Kumpulan data berisi 7481 gambar pelatihan yang dianotasi dengan kotak pembatas 3D. Deskripsi lengkap tentang anotasi dapat ditemukan di readme readme kit pengembangan objek di beranda Kitti.
Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Beranda : http://www.cvlibs.net/datasets/kitti/
Kode sumber :
tfds.datasets.kitti.Builder
Versi :
-
3.1.0
: Tidak ada catatan rilis. -
3.2.0
: Devkit diperbarui. -
3.3.0
(default): Menambahkan label untuk fituroccluded
.
-
Ukuran unduhan :
11.71 GiB
Ukuran kumpulan data :
5.27 GiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 711 |
'train' | 6.347 |
'validation' | 423 |
- Struktur fitur :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama_file | Teks | rangkaian | ||
objek | Urutan | |||
objek/alfa | Tensor | float32 | Sudut pengamatan benda, rentang [-pi..pi] | |
objek/bbox | Fitur BBox | (4,) | float32 | Kotak pembatas objek 2D pada gambar |
benda/dimensi | Tensor | (3,) | float32 | Dimensi objek 3D: tinggi, lebar, panjang (dalam meter) |
objek/lokasi | Tensor | (3,) | float32 | Lokasi objek 3D x,y,z dalam koordinat kamera (dalam meter) |
benda/tertutup | Label Kelas | int64 | Bilangan bulat (0,1,2,3) menunjukkan keadaan oklusi: 0 = terlihat sepenuhnya, 1 = tersumbat sebagian2 = tersumbat sebagian besar, 3 = tidak diketahui | |
objek/rotasi_y | Tensor | float32 | Rotasi ry di sekitar sumbu Y dalam koordinat kamera [-pi..pi] | |
benda/terpotong | Tensor | float32 | Float dari 0 (tidak terpotong) ke 1 (terpotong), dimana terpotong mengacu pada objek yang meninggalkan batas gambar | |
objek/tipe | Label Kelas | int64 | Jenis objek, misalnya 'Mobil' atau 'Van' |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}