스몰노브

이 데이터베이스는 모양에서 3D 개체 인식 실험을 위한 것입니다. 여기에는 네발 달린 동물, 인물, 비행기, 트럭, 자동차 등 5가지 일반 범주에 속하는 50개의 장난감 이미지가 포함되어 있습니다. 물체는 6개의 조명 조건, 9개의 고도(5도마다 30~70도) 및 18개의 방위각(20도마다 0~340도)에서 두 대의 카메라로 촬영되었습니다.

훈련 세트는 각 카테고리의 5개 인스턴스(인스턴스 4, 6, 7, 8, 9)와 나머지 5개 인스턴스(인스턴스 0, 1, 2, 3, 5)의 테스트 세트로 구성됩니다.

나뉘다
'test' 24,300
'train' 24,300
  • 기능 구조 :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
영상 영상 (96, 96, 1) uint8
이미지2 영상 (96, 96, 1) uint8
사례 클래스 레이블 int64
label_azimuth 클래스 레이블 int64
label_category 클래스 레이블 int64
label_elevation 클래스 레이블 int64
label_조명 클래스 레이블 int64
  • 인용 :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}