小さなノルブ

  • 説明

このデータベースは、形状からの三次元物体認識の実験を目的としています。これには、4 本足の動物、人物、飛行機、トラック、車の 5 つの一般的なカテゴリに属する​​ 50 個のおもちゃの画像が含まれています。対象物は、6 つの照明条件、9 つの仰角 (5 度ごとに 30 ~ 70 度)、および 18 の方位角 (20 度ごとに 0 ~ 340 度) の下で 2 台のカメラで撮影されました。

トレーニング セットは、各カテゴリの 5 つのインスタンス (インスタンス 4、6、7、8、および 9) と、残りの 5 つのインスタンス (インスタンス 0、1、2、3、および 5) のテスト セットで構成されます。

スプリット
'test' 24,300
'train' 24,300
  • 機能の構造:
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
画像画像(96、96、1) uint8
画像2画像(96、96、1) uint8
実例クラスラベルint64
ラベルの方位角クラスラベルint64
ラベルカテゴリークラスラベルint64
ラベル_標高クラスラベルint64
ラベル_照明クラスラベルint64
  • 引用
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}