Китти

  • Описание :

Kitti содержит набор задач машинного зрения, созданных с использованием платформы автономного вождения. Полный тест содержит множество задач, таких как стерео, оптический поток, визуальная одометрия и т. д. Этот набор данных содержит набор данных для обнаружения объектов, включая монокулярные изображения и ограничивающие рамки. Набор данных содержит 7481 обучающее изображение, помеченное трехмерными ограничивающими рамками. Полное описание аннотаций можно найти в файле readme комплекта разработки объектов на домашней странице Kitti.

Расколоть Примеры
'test' 711
'train' 6,347
'validation' 423
  • Структура функции :
FeaturesDict({
   
'image': Image(shape=(None, None, 3), dtype=uint8),
   
'image/file_name': Text(shape=(), dtype=string),
   
'objects': Sequence({
       
'alpha': float32,
       
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
       
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
       
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
       
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
       
'rotation_y': float32,
       
'truncated': float32,
       
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
   
}),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (Нет, Нет, 3) uint8
изображение/имя_файла Текст нить
объекты Последовательность
объекты/альфа Тензор поплавок32 Угол наблюдения объекта в диапазоне [-pi..pi]
объекты/bbox BBoxFeature (4,) поплавок32 2D-ограничительная рамка объекта на изображении
объекты/размеры Тензор (3,) поплавок32 Размеры 3D-объекта: высота, ширина, длина (в метрах)
объекты/локация Тензор (3,) поплавок32 Местоположение 3D-объекта x,y,z в координатах камеры (в метрах)
объекты/закрыты Класслейбл int64 Целое число (0,1,2,3), указывающее состояние окклюзии: 0 = полностью видно, 1 = частично закрыто, 2 = сильно закрыто, 3 = неизвестно.
объекты/rotation_y Тензор поплавок32 Вращение ry вокруг оси Y в координатах камеры [-pi..pi]
объекты/усеченные Тензор поплавок32 Плавающее значение от 0 (не усечено) до 1 (усечено), где усечено относится к объекту, выходящему за границы изображения.
объекты/тип Класслейбл int64 Тип объекта, например «Автомобиль» или «Фургон».

Визуализация

  • Цитата :
@inproceedings{Geiger2012CVPR,
  author
= {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title
= {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle
= {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year
= {2012}
}