kucing

  • Keterangan :

Kitti berisi serangkaian tugas penglihatan yang dibangun menggunakan platform mengemudi otonom. Tolok ukur lengkap berisi banyak tugas seperti stereo, aliran optik, odometri visual, dll. Kumpulan data ini berisi kumpulan data deteksi objek, termasuk gambar monokuler dan kotak pembatas. Kumpulan data berisi 7481 gambar pelatihan yang dianotasi dengan kotak pembatas 3D. Deskripsi lengkap tentang anotasi dapat ditemukan di readme readme kit pengembangan objek di beranda Kitti.

Membelah Contoh
'test' 711
'train' 6.347
'validation' 423
  • Struktur fitur :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
gambar Gambar (Tidak ada, Tidak ada, 3) uint8
gambar/nama_file Teks rangkaian
objek Urutan
objek/alfa Tensor float32 Sudut pengamatan benda, rentang [-pi..pi]
objek/bbox Fitur BBox (4,) float32 Kotak pembatas objek 2D pada gambar
benda/dimensi Tensor (3,) float32 Dimensi objek 3D: tinggi, lebar, panjang (dalam meter)
objek/lokasi Tensor (3,) float32 Lokasi objek 3D x,y,z dalam koordinat kamera (dalam meter)
benda/tertutup Label Kelas int64 Bilangan bulat (0,1,2,3) menunjukkan keadaan oklusi: 0 = terlihat sepenuhnya, 1 = tersumbat sebagian2 = tersumbat sebagian besar, 3 = tidak diketahui
objek/rotasi_y Tensor float32 Rotasi ry di sekitar sumbu Y dalam koordinat kamera [-pi..pi]
benda/terpotong Tensor float32 Float dari 0 (tidak terpotong) ke 1 (terpotong), dimana terpotong mengacu pada objek yang meninggalkan batas gambar
objek/tipe Label Kelas int64 Jenis objek, misalnya 'Mobil' atau 'Van'

Visualisasi

  • Kutipan :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}