com.smallnorb

  • وصف :

قاعدة البيانات هذه مخصصة لإجراء تجارب التعرف على الكائنات ثلاثية الأبعاد من الشكل. يحتوي على صور لـ 50 لعبة تنتمي إلى 5 فئات عامة: حيوانات ذات أربع أرجل، وشخصيات بشرية، وطائرات، وشاحنات، وسيارات. تم تصوير الأجسام بواسطة كاميرتين تحت 6 ظروف إضاءة، و9 ارتفاعات (30 إلى 70 درجة كل 5 درجات)، و18 سمت (0 إلى 340 كل 20 درجة).

تتكون مجموعة التدريب من 5 مثيلات من كل فئة (المثيلات 4 و6 و7 و8 و9)، ومجموعة الاختبار للمثيلات الخمس المتبقية (المثيلات 0 و1 و2 و3 و5).

ينقسم أمثلة
'test' 24300
'train' 24300
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (96، 96، 1) uint8
image2 صورة (96، 96، 1) uint8
مثال ClassLabel int64
label_azimuth ClassLabel int64
label_category ClassLabel int64
label_elevation ClassLabel int64
label_lighting ClassLabel int64
  • الاقتباس :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}