smallnorb

Ta baza danych jest przeznaczona do eksperymentów w rozpoznawaniu obiektów 3D na podstawie kształtu. Zawiera obrazy 50 zabawek należących do 5 ogólnych kategorii: czworonożne zwierzęta, postacie ludzkie, samoloty, ciężarówki i samochody. Obiekty zostały sfotografowane przez dwie kamery w 6 warunkach oświetleniowych, 9 elewacjach (30 do 70 stopni co 5 stopni) i 18 azymutach (0 do 340 co 20 stopni).

Zbiór uczący składa się z 5 instancji każdej kategorii (instancje 4, 6, 7, 8 i 9), a zbiór testowy z pozostałych 5 instancji (instancje 0, 1, 2, 3 i 5).

Podział Przykłady
'test' 24 300
'train' 24 300
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
obraz Obraz (96, 96, 1) uint8
obraz2 Obraz (96, 96, 1) uint8
instancja Etykieta klasy int64
azymut_etykiety Etykieta klasy int64
kategoria_etykiety Etykieta klasy int64
elewacja_etykiety Etykieta klasy int64
oświetlenie_etykiet Etykieta klasy int64
  • Cytat :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}