imagenet_lt

  • Описание :

ImageNet-LT — это подмножество исходного набора данных ImageNet ILSVRC 2012. Обучающий набор подвергается субдискретизации таким образом, чтобы количество изображений в классе соответствовало распределению с длинными хвостами. Класс с максимальным количеством изображений содержит 1280 примеров, тогда как класс с минимальным количеством изображений содержит только 5 примеров. Набор данных также имеет сбалансированный проверочный набор, который также является подмножеством обучающего набора ImageNet ILSGRC 2012 и содержит 20 изображений на класс. Тестовый набор этого набора данных такой же, как и проверочный набор исходного набора данных ImageNet ILSVRC 2012.

Исходный набор данных ImageNet ILSVRC 2012 должен быть загружен вручную, а его путь должен быть указан с --manual_dir для создания этого набора данных.

  • Дополнительная документация : изучить документы с кодом

  • Домашняя страница : https://github.com/zhmiao/OpenLongTailRecognition-OLTR

  • Исходный код : tfds.datasets.imagenet_lt.Builder

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : 5.21 MiB

  • Размер набора данных : 20.92 GiB

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на http://www.image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.

  • Автоматическое кэширование ( документация ): Нет

  • Сплиты :

Расколоть Примеры
'test' 50 000
'train' 115 846
'validation' 20 000
  • Структура функции :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
имя файла Текст нить
изображение Изображение (Нет, Нет, 3) uint8
этикетка Метка класса int64

Визуализация

  • Цитата :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}