imagenet2012_fewshot

  • 설명 :

Imagenet2012Fewshot은 원본 ImageNet ILSVRC 2012 데이터 세트의 하위 집합입니다. 데이터 세트는 원본 ImageNet ILSVRC 2012 데이터 세트와 동일한 검증 세트를 공유합니다. 그러나 트레이닝 세트는 레이블 균형 방식으로 서브샘플링됩니다. 5shot 구성에서는 레이블당 5개의 이미지 또는 5000개의 이미지가 샘플링됩니다. 10shot 구성에서는 레이블당 10개의 이미지 또는 10000개의 이미지가 샘플링됩니다.

  • 홈페이지 : http://image-net.org/

  • 소스 코드 : tfds.datasets.imagenet2012_fewshot.Builder

  • 버전 :

    • 2.0.0 : 유효성 검사 레이블을 수정합니다.
    • 2.0.1 : 인코딩 수정. 사용자 관점에서 변경 사항이 없습니다.
    • 3.0.0 : ~12개 이미지의 색상화 수정(CMYK -> RGB). 일관성을 위해 형식을 수정합니다(단일 png 이미지를 Jpeg로 변환). 아카이브에서 직접 읽기 속도가 빨라집니다.

    • 4.0.0 : (미공개)

    • 5.0.0 : 새로운 분할 API( https://tensorflow.org/datasets/splits )

    • 5.0.1 (기본값): 릴리스 정보가 없습니다.

    • 5.1.0 : 테스트 분할이 추가되었습니다.

  • 다운로드 크기 : Unknown size

  • 수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir 에 수동으로 다운로드해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
    manual_dir에는 ILSVRC2012_img_train.tar 및 ILSVRC2012_img_val.tar의 두 파일이 포함되어야 합니다. 데이터 세트를 다운로드할 수 있는 링크를 얻으려면 https://image-net.org/download-images 에 등록해야 합니다.

  • 자동 캐시 ( 문서 ): 아니요

  • 기능 구조 :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
파일 이름 텍스트
영상 영상 (없음, 없음, 3) uint8
상표 클래스 레이블 int64
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot(기본 구성)

  • 구성 설명 : 전체 ImageNet 학습 세트의 1샷.

  • 데이터세트 크기 : 6.46 GiB

  • 분할 :

나뉘다
'train' 1,000
'tune' 1,000
'validation' 50,000

심상

imagenet2012_fewshot/5shot

  • 구성 설명 : 총 ImageNet 학습 세트의 5샷.

  • 데이터세트 크기 : 6.88 GiB

  • 분할 :

나뉘다
'train' 5,000
'tune' 1,000
'validation' 50,000

심상

imagenet2012_fewshot/10shot

  • 구성 설명 : 총 ImageNet 학습 세트의 10샷.

  • 데이터세트 크기 : 7.42 GiB

  • 분할 :

나뉘다
'train' 10,000
'tune' 1,000
'validation' 50,000

심상