stanford_dogs

설명 :

Stanford Dogs 데이터 세트에는 전 세계 120종의 개 이미지가 포함되어 있습니다. 이 데이터 세트는 세분화된 이미지 분류 작업을 위해 ImageNet의 이미지 및 주석을 사용하여 구축되었습니다. 20,580개의 이미지가 있으며 그 중 12,000개는 훈련용으로, 8580개는 테스트용으로 사용됩니다. 12,000개의 모든 이미지에 대해 클래스 레이블과 경계 상자 주석이 제공됩니다.

추가 문서 : 코드가 있는 논문에서 탐색
홈페이지 : http://vision.stanford.edu/aditya86/ImageNetDogs/main.html
소스 코드 : tfds.datasets.stanford_dogs.Builder
버전 :
- 0.2.0 (기본값): 릴리스 정보가 없습니다.
다운로드 크기 : 778.12 MiB
데이터 세트 크기 : 744.72 MiB
자동 캐시 ( 문서 ): 아니요
분할 :

나뉘다	예
`'test'`	8,580
`'train'`	12,000

기능 구조 :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
    }),
})

기능 문서 :

특징	수업	모양	D타입
	풍모Dict
영상	영상	(없음, 없음, 3)	uint8
이미지/파일 이름	텍스트		끈
상표	클래스 레이블		int64
사물	순서
개체/bbox	BBox기능	(4,)	float32

감독 키 ( as_supervised 문서 참조): ('image', 'label')
그림 ( tfds.show_examples ):

예 ( tfds.as_dataframe ):

인용 :

@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
          Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
             IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
        AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
                  Li, K. and Fei-Fei, L.},
        TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
        BOOKTITLE = {CVPR09},
        YEAR = {2009},
        BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}