smallnorb

  • תיאור :

מסד נתונים זה מיועד לניסויים בזיהוי אובייקטים תלת מימדיים מצורה. הוא מכיל תמונות של 50 צעצועים השייכים ל-5 קטגוריות גנריות: חיות עם ארבע רגליים, דמויות אנושיות, מטוסים, משאיות ומכוניות. האובייקטים צולמו על ידי שתי מצלמות ב-6 תנאי תאורה, 9 גבהים (30 עד 70 מעלות כל 5 מעלות), ו-18 אזימוטים (0 עד 340 כל 20 מעלות).

מערך ההדרכה מורכב מ-5 מקרים מכל קטגוריה (מקרים 4, 6, 7, 8 ו-9), ומערכת המבחנים של 5 המקרים הנותרים (מקרים 0, 1, 2, 3 ו-5).

לְפַצֵל דוגמאות
'test' 24,300
'train' 24,300
  • מבנה תכונה :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תמונה תמונה (96, 96, 1) uint8
תמונה 2 תמונה (96, 96, 1) uint8
למשל ClassLabel int64
label_azimuth ClassLabel int64
label_category ClassLabel int64
label_elevation ClassLabel int64
תווית_תאורה ClassLabel int64
  • ציטוט :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}