kucing

Keterangan :

Kitti berisi serangkaian tugas penglihatan yang dibangun menggunakan platform mengemudi otonom. Tolok ukur lengkap berisi banyak tugas seperti stereo, aliran optik, odometri visual, dll. Kumpulan data ini berisi kumpulan data deteksi objek, termasuk gambar monokuler dan kotak pembatas. Kumpulan data berisi 7481 gambar pelatihan yang dianotasi dengan kotak pembatas 3D. Deskripsi lengkap tentang anotasi dapat ditemukan di readme readme kit pengembangan objek di beranda Kitti.

Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Beranda : http://www.cvlibs.net/datasets/kitti/
Kode sumber : tfds.datasets.kitti.Builder
Versi :
- 3.1.0 : Tidak ada catatan rilis.
- 3.2.0 : Devkit diperbarui.
- 3.3.0 (default): Menambahkan label untuk fitur occluded .
Ukuran unduhan : 11.71 GiB
Ukuran kumpulan data : 5.27 GiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'test'`	711
`'train'`	6.347
`'validation'`	423

Struktur fitur :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D	Keterangan
	FiturDict
gambar	Gambar	(Tidak ada, Tidak ada, 3)	uint8
gambar/nama_file	Teks		rangkaian
objek	Urutan
objek/alfa	Tensor		float32	Sudut pengamatan benda, rentang [-pi..pi]
objek/bbox	Fitur BBox	(4,)	float32	Kotak pembatas objek 2D pada gambar
benda/dimensi	Tensor	(3,)	float32	Dimensi objek 3D: tinggi, lebar, panjang (dalam meter)
objek/lokasi	Tensor	(3,)	float32	Lokasi objek 3D x,y,z dalam koordinat kamera (dalam meter)
benda/tertutup	Label Kelas		int64	Bilangan bulat (0,1,2,3) menunjukkan keadaan oklusi: 0 = terlihat sepenuhnya, 1 = tersumbat sebagian2 = tersumbat sebagian besar, 3 = tidak diketahui
objek/rotasi_y	Tensor		float32	Rotasi ry di sekitar sumbu Y dalam koordinat kamera [-pi..pi]
benda/terpotong	Tensor		float32	Float dari 0 (tidak terpotong) ke 1 (terpotong), dimana terpotong mengacu pada objek yang meninggalkan batas gambar
objek/tipe	Label Kelas		int64	Jenis objek, misalnya 'Mobil' atau 'Van'

Kunci yang diawasi (Lihat dokumen as_supervised ): None
Gambar ( tfds.show_examples ):

Visualisasi

Contoh ( tfds.as_dataframe ):

Kutipan :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}