cifar10_1

  • 설명 :

CIFAR-10.1 데이터세트는 CIFAR-10을 위한 새로운 테스트 세트입니다. CIFAR-10.1에는 원본 CIFAR-10 데이터 세트에 대한 수년간의 연구 끝에 샘플링된 약 2,000개의 새로운 테스트 이미지가 포함되어 있습니다. CIFAR-10.1의 데이터 수집은 원본 데이터 세트에 비해 분포 이동을 최소화하도록 설계되었습니다. 우리는 "CIFAR-10 분류자가 CIFAR-10을 일반화합니까?"라는 논문에서 CIFAR-10.1의 생성에 대해 설명합니다. CIFAR-10.1의 이미지는 TinyImages 데이터 세트의 하위 집합입니다. 현재 CIFAR-10.1 데이터 세트에는 v4와 v6의 두 가지 버전이 있습니다.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 기능 문서 :
특징 수업 모양 Dtype 설명
특징Dict
영상 영상 (32, 32, 3) uint8
상표 클래스 라벨 정수64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (기본 구성)

  • 구성 설명 : 분류기를 테스트한 데이터 세트의 첫 번째 버전입니다. 위에서 언급한 것처럼 이는 v4 데이터 세트를 우리가 평가하는 분류기와 독립적으로 만듭니다. 본 논문의 주요 섹션에 보고된 숫자는 이 버전의 데이터 세트를 사용합니다. 각 클래스별로 상위 25개의 TinyImages 키워드로 구축되었기 때문에 약간의 클래스 불균형이 발생했습니다. 가장 큰 차이점은 선박이 테스트 세트의 10%가 아닌 8%만을 구성한다는 것입니다. v4에는 2,021개의 이미지가 포함되어 있습니다.

  • 다운로드 크기 : 5.93 MiB

  • 데이터세트 크기 : 4.46 MiB

  • 분할 :

나뉘다
'test' 2,021

심상

cifar10_1/v6

  • 구성 설명 : 정확히 클래스 균형을 맞춘 약간 개선된 키워드 할당에서 파생됩니다. 이 버전의 데이터 세트는 우리 논문의 부록 D에 있는 결과에 해당합니다. v6에는 2,000개의 이미지가 포함되어 있습니다.

  • 다운로드 크기 : 5.87 MiB

  • 데이터세트 크기 : 4.40 MiB

  • 분할 :

나뉘다
'test' 2,000

심상