- Tanım :
Kitti, otonom bir sürüş platformu kullanılarak oluşturulmuş bir dizi görsel görev içerir. Tam kıyaslama, stereo, optik akış, görsel odometri vb. gibi birçok görevi içerir. Bu veri seti, monoküler görüntüler ve sınırlayıcı kutular dahil olmak üzere nesne algılama veri setini içerir. Veri kümesi, 3B sınırlayıcı kutularla açıklamalı 7481 eğitim görüntüsü içerir. Ek açıklamaların tam açıklamasını Kitti ana sayfasındaki nesne geliştirme kiti benioku benioku dosyasında bulabilirsiniz.
Ana sayfa : http://www.cvlibs.net/datasets/kitti/
Kaynak kodu :
tfds.datasets.kitti.Builder
Sürümler :
-
3.1.0
: Sürüm notu yok. -
3.2.0
: Devkit güncellendi. -
3.3.0
(varsayılan):occluded
özellik için etiketler eklendi.
-
İndirme boyutu :
11.71 GiB
Veri kümesi boyutu :
5.27 GiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 711 |
'train' | 6.347 |
'validation' | 423 |
- Özellik yapısı :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
görüntü | Resim | (Yok, Yok, 3) | uint8 | |
resim/dosya_adı | Metin | sicim | ||
nesneler | Sekans | |||
nesneler/alfa | Tensör | kayan nokta32 | Nesnenin gözlem açısı, [-pi..pi] aralığında | |
nesneler/bbox | BBoxÖzelliği | (4,) | kayan nokta32 | Görüntüdeki nesnenin 2B sınırlayıcı kutusu |
nesneler/boyutlar | Tensör | (3,) | kayan nokta32 | 3B nesne boyutları: yükseklik, genişlik, uzunluk (metre cinsinden) |
nesneler/konum | Tensör | (3,) | kayan nokta32 | Kamera koordinatlarında (metre cinsinden) 3 boyutlu nesne konumu x,y,z |
nesneler/kapalı | SınıfEtiketi | int64 | Tıkanma durumunu gösteren tam sayı (0,1,2,3): 0 = tamamen görünür, 1 = kısmen tıkalı2 = büyük ölçüde tıkalı, 3 = bilinmiyor | |
nesneler/rotasyon_y | Tensör | kayan nokta32 | Kamera koordinatlarında Y ekseni etrafında dönme [-pi..pi] | |
nesneler/kesilmiş | Tensör | kayan nokta32 | 0'dan (kesilmemiş) 1'e (kesilmiş) kayan; burada kesilmiş, görüntü sınırlarını terk eden nesneyi ifade eder | |
nesneler/tür | SınıfEtiketi | int64 | Nesnenin türü, örneğin 'Araba' veya 'Van' |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}