stanford_dogs

  • 설명 :

Stanford Dogs 데이터 세트에는 전 세계 120종의 개 이미지가 포함되어 있습니다. 이 데이터 세트는 세분화된 이미지 분류 작업을 위해 ImageNet의 이미지 및 주석을 사용하여 구축되었습니다. 20,580개의 이미지가 있으며 그 중 12,000개는 훈련용으로, 8580개는 테스트용으로 사용됩니다. 12,000개의 모든 이미지에 대해 클래스 레이블과 경계 상자 주석이 제공됩니다.

나뉘다
'test' 8,580
'train' 12,000
  • 기능 구조 :
FeaturesDict({
   
'image': Image(shape=(None, None, 3), dtype=uint8),
   
'image/filename': Text(shape=(), dtype=string),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
   
'objects': Sequence({
       
'bbox': BBoxFeature(shape=(4,), dtype=float32),
   
}),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
영상 영상 (없음, 없음, 3) uint8
이미지/파일 이름 텍스트
상표 클래스 레이블 int64
사물 순서
개체/bbox BBox기능 (4,) float32

심상

  • 인용 :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author
= "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
          Li Fei-Fei"
,
title
= "Novel Dataset for Fine-Grained Image Categorization",
booktitle
= "First Workshop on Fine-Grained Visual Categorization,
             IEEE Conference on Computer Vision and Pattern Recognition"
,
year
= "2011",
month
= "June",
address
= "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
        AUTHOR
= {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
                 
Li, K. and Fei-Fei, L.},
        TITLE
= { {ImageNet: A Large-Scale Hierarchical Image Database} },
        BOOKTITLE
= {CVPR09},
        YEAR
= {2009},
        BIBSOURCE
= "http://www.image-net.org/papers/imagenet_cvpr09.bib"}