Visualisasi : Jelajahi di Kenali Data Anda
Deskripsi :
Kitti berisi serangkaian tugas penglihatan yang dibangun menggunakan platform mengemudi otonom. Tolok ukur lengkap berisi banyak tugas seperti stereo, aliran optik, odometri visual, dll. Kumpulan data ini berisi kumpulan data deteksi objek, termasuk gambar bermata dan kotak pembatas. Dataset berisi 7481 gambar pelatihan yang dianotasi dengan kotak pembatas 3D. Deskripsi lengkap tentang anotasi dapat ditemukan di readme kit pengembangan objek readme di beranda Kitti.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://www.cvlibs.net/datasets/kitti/
Kode sumber :
tfds.datasets.kitti.Builder
Versi :
-
3.1.0
: Tidak ada catatan rilis. -
3.2.0
: Devkit diperbarui. -
3.3.0
(default): Menambahkan label untuk fituroccluded
.
-
Ukuran unduhan :
11.71 GiB
Ukuran dataset :
5.27 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 711 |
'train' | 6.347 |
'validation' | 423 |
- Struktur fitur :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama_berkas | Teks | rangkaian | ||
objek | Urutan | |||
objek/alfa | Tensor | float32 | Sudut pengamatan objek, mulai [-pi..pi] | |
benda/bbox | Fitur BBox | (4,) | float32 | Kotak pembatas objek 2D pada gambar |
benda/dimensi | Tensor | (3,) | float32 | Dimensi objek 3D: tinggi, lebar, panjang (dalam meter) |
benda/lokasi | Tensor | (3,) | float32 | Lokasi objek 3D x,y,z dalam koordinat kamera (dalam meter) |
benda/tertutup | LabelKelas | int64 | Bilangan bulat (0,1,2,3) menunjukkan keadaan oklusi: 0 = terlihat sepenuhnya, 1 = tertutup sebagian2 = tertutup sebagian besar, 3 = tidak diketahui | |
objek/rotasi_y | Tensor | float32 | Rotasi di sekitar sumbu Y dalam koordinat kamera [-pi..pi] | |
objek/terpotong | Tensor | float32 | Mengambang dari 0 (non-terpotong) ke 1 (terpotong), di mana terpotong mengacu pada objek yang meninggalkan batas gambar | |
benda/jenis | LabelKelas | int64 | Jenis objek, misalnya 'Mobil' atau 'Van' |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}