imagenet_lt

  • 설명 :

ImageNet-LT는 원본 ImageNet ILSVRC 2012 데이터 세트의 하위 집합입니다. 트레이닝 세트는 클래스당 이미지 수가 긴 꼬리 분포를 따르도록 서브샘플링됩니다. 최대 이미지 수가 있는 클래스는 1,280개의 예제를 포함하는 반면 이미지 수가 가장 적은 클래스는 5개의 예제만 포함합니다. 이 데이터 세트에는 ImageNet ILSVRC 2012 교육 세트의 하위 세트이기도 한 균형 잡힌 유효성 검사 세트가 있으며 클래스당 20개의 이미지가 포함되어 있습니다. 이 데이터 세트의 테스트 세트는 원본 ImageNet ILSVRC 2012 데이터 세트의 검증 세트와 동일합니다.

원본 ImageNet ILSVRC 2012 데이터 세트는 수동으로 다운로드해야 하며 이 데이터 세트를 생성하려면 해당 경로를 --manual_dir로 설정해야 합니다.

나뉘다
'test' 50,000
'train' 115,846
'validation' 20,000
  • 기능 구조 :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
파일 이름 텍스트
영상 영상 (없음, 없음, 3) uint8
상표 클래스 레이블 int64

심상

  • 인용 :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}