קיטי

Kitti מכיל חבילה של משימות ראייה שנבנו באמצעות פלטפורמת נהיגה אוטונומית. ה-benchmark המלא מכיל משימות רבות כגון סטריאו, זרימה אופטית, בדיקת מרחק חזותית וכו'. מערך נתונים זה מכיל את מערך הנתונים של זיהוי האובייקטים, כולל התמונות המונוקולריות והתיבות התוחמות. מערך הנתונים מכיל 7481 תמונות אימון עם הערות בתיבות תוחמות תלת ממדיות. ניתן למצוא תיאור מלא של ההערות ב-readme של ערכת פיתוח האובייקט readme בדף הבית של Kitti.

לְפַצֵל דוגמאות
'test' 711
'train' 6,347
'validation' 423
  • מבנה תכונה :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תמונה תמונה (אין, אין, 3) uint8
image/file_name טֶקסט חוּט
חפצים סדר פעולות
חפצים/אלפא מוֹתֵחַ לצוף32 זווית תצפית של אובייקט, בטווח [-pi..pi]
אובייקטים/bbox BBoxFeature (4,) לצוף32 תיבת תוחמת דו-ממדית של אובייקט בתמונה
חפצים/מידות מוֹתֵחַ (3,) לצוף32 ממדי אובייקט תלת מימד: גובה, רוחב, אורך (במטרים)
חפצים/מיקום מוֹתֵחַ (3,) לצוף32 מיקום אובייקט תלת-ממדי x,y,z בקואורדינטות של המצלמה (במטרים)
חפצים/חסומים ClassLabel int64 מספר שלם (0,1,2,3) המציין מצב חסימה: 0 = גלוי לחלוטין, 1 = חסום חלקית 2 = חסום ברובו, 3 = לא ידוע
objects/rotation_y מוֹתֵחַ לצוף32 סיבוב רי סביב ציר Y בקואורדינטות המצלמה [-pi..pi]
חפצים/קטועים מוֹתֵחַ לצוף32 צף מ-0 (לא קצוץ) ל-1 (קטוע), כאשר קצוץ מתייחס לאובייקט שעוזב את גבולות התמונה
אובייקטים/סוג ClassLabel int64 סוג האובייקט, למשל 'מכונית' או 'וואן'

רְאִיָה

  • ציטוט :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}