котенок

Kitti содержит набор задач для машинного зрения, созданных с использованием платформы для автономного вождения. Полный тест содержит множество задач, таких как стерео, оптический поток, визуальная одометрия и т. д. Этот набор данных содержит набор данных обнаружения объектов, включая монокулярные изображения и ограничивающие рамки. Набор данных содержит 7481 обучающее изображение, аннотированное 3D ограничивающими рамками. Полное описание аннотаций можно найти в файле readme пакета разработки объектов на домашней странице Kitti.

  • Домашняя страница : http://www.cvlibs.net/datasets/kitti/

  • Исходный код : tfds.object_detection.Kitti

  • Версии :

    • 3.1.0 : Нет примечаний к выпуску.
    • 3.2.0 : обновлен комплект для разработки.
    • 3.3.0 (по умолчанию) : добавлены метки для occluded функции.
  • Размер загрузки : 11.71 GiB

  • Размер набора данных : 5.27 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплиты :

Расколоть Примеры
'test' 711
'train' 6347
'validation' 423
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
изображение/имя_файла Текст tf.string
объекты Последовательность
объекты/альфа Тензор tf.float32 Угол наблюдения объекта, диапазон [-pi..pi]
объекты/bbox BBoxFeature (4,) tf.float32 2D ограничивающая рамка объекта на изображении
объекты/размеры Тензор (3,) tf.float32 Размеры 3D объекта: высота, ширина, длина (в метрах)
объекты/местоположение Тензор (3,) tf.float32 Местоположение трехмерного объекта x,y,z в координатах камеры (в метрах)
объекты/закрытые Метка класса tf.int64 Целое число (0,1,2,3), указывающее состояние окклюзии: 0 = полностью видно, 1 = частично окклюзировано 2 = в значительной степени окклюзировано, 3 = неизвестно
объекты/rotation_y Тензор tf.float32 Вращение ry вокруг оси Y в координатах камеры [-pi..pi]
объекты/усеченные Тензор tf.float32 Плавающая от 0 (не усеченный) до 1 (усеченный), где усеченный относится к объекту, выходящему за границы изображения
объекты/тип Метка класса tf.int64 Тип объекта, например «Автомобиль» или «Фургон».

Визуализация

  • Цитата :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}