imagenet_lt

  • opis :

ImageNet-LT jest podzbiorem oryginalnego zbioru danych ImageNet ILSVRC 2012. Zbiór uczący jest podpróbkowany w taki sposób, że liczba obrazów na klasę jest zgodna z rozkładem z długim ogonem. Klasa z maksymalną liczbą obrazków zawiera 1280 przykładów, natomiast klasa z minimalną liczbą obrazków zawiera tylko 5 przykładów. Zbiór danych ma również zrównoważony zestaw do sprawdzania poprawności, który jest również podzbiorem zestawu szkoleniowego ImageNet ILSVRC 2012 i zawiera 20 obrazów na klasę. Zestaw testowy tego zestawu danych jest taki sam, jak zestaw do walidacji oryginalnego zestawu danych ImageNet ILSVRC 2012.

Oryginalny zestaw danych ImageNet ILSVRC 2012 należy pobrać ręcznie, a jego ścieżkę należy ustawić za pomocą opcji --manual_dir, aby wygenerować ten zestaw danych.

Rozdzielać Przykłady
'test' 50 000
'train' 115 846
'validation' 20 000
  • Struktura funkcji :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
Nazwa pliku Tekst strunowy
obraz Obraz (Brak, Brak, 3) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

  • Cytat :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}