- 설명 :
CIFAR-10.1 데이터세트는 CIFAR-10을 위한 새로운 테스트 세트입니다. CIFAR-10.1에는 원본 CIFAR-10 데이터 세트에 대한 수년간의 연구 끝에 샘플링된 약 2,000개의 새로운 테스트 이미지가 포함되어 있습니다. CIFAR-10.1의 데이터 수집은 원본 데이터 세트에 비해 분포 이동을 최소화하도록 설계되었습니다. 우리는 "CIFAR-10 분류자가 CIFAR-10을 일반화합니까?"라는 논문에서 CIFAR-10.1의 생성에 대해 설명합니다. CIFAR-10.1의 이미지는 TinyImages 데이터 세트의 하위 집합입니다. 현재 CIFAR-10.1 데이터 세트에는 v4와 v6의 두 가지 버전이 있습니다.
버전 :
-
1.1.0
(기본값): 릴리스 노트가 없습니다.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (32, 32, 3) | uint8 | |
상표 | 클래스 라벨 | 정수64 |
감독되는 키 (
as_supervised
doc 참조):('image', 'label')
인용 :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (기본 구성)
구성 설명 : 분류기를 테스트한 데이터 세트의 첫 번째 버전입니다. 위에서 언급한 것처럼 이는 v4 데이터 세트를 우리가 평가하는 분류기와 독립적으로 만듭니다. 본 논문의 주요 섹션에 보고된 숫자는 이 버전의 데이터 세트를 사용합니다. 각 클래스별로 상위 25개의 TinyImages 키워드로 구축되었기 때문에 약간의 클래스 불균형이 발생했습니다. 가장 큰 차이점은 선박이 테스트 세트의 10%가 아닌 8%만을 구성한다는 것입니다. v4에는 2,021개의 이미지가 포함되어 있습니다.
다운로드 크기 :
5.93 MiB
데이터세트 크기 :
4.46 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,021 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
cifar10_1/v6
구성 설명 : 정확히 클래스 균형을 맞춘 약간 개선된 키워드 할당에서 파생됩니다. 이 버전의 데이터 세트는 우리 논문의 부록 D에 있는 결과에 해당합니다. v6에는 2,000개의 이미지가 포함되어 있습니다.
다운로드 크기 :
5.87 MiB
데이터세트 크기 :
4.40 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,000 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):