cifar10_1

O conjunto de dados CIFAR-10.1 é um novo conjunto de teste para CIFAR-10. O CIFAR-10.1 contém aproximadamente 2.000 novas imagens de teste que foram amostradas após vários anos de pesquisa no conjunto de dados CIFAR-10 original. A coleta de dados para CIFAR-10.1 foi projetada para minimizar a mudança de distribuição em relação ao conjunto de dados original. Descrevemos a criação do CIFAR-10.1 no artigo "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". As imagens no CIFAR-10.1 são um subconjunto do conjunto de dados TinyImages. Atualmente, existem duas versões do conjunto de dados CIFAR-10.1: v4 e v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (32, 32, 3) uint8
etiqueta ClassLabel int64
  • Chaves supervisionadas (Consulte as_supervised doc ): ('image', 'label')

  • Citação :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (configuração padrão)

  • Descrição da configuração : É a primeira versão do nosso conjunto de dados na qual testamos qualquer classificador. Conforme mencionado acima, isso torna o conjunto de dados v4 independente dos classificadores que avaliamos. Os números relatados nas seções principais de nosso artigo usam essa versão do conjunto de dados. Ele foi construído a partir das 25 principais palavras-chave do TinyImages para cada classe, o que levou a um leve desequilíbrio de classes. A maior diferença é que os navios representam apenas 8% do conjunto de teste em vez de 10%. v4 contém 2.021 imagens.

  • Tamanho do download : 5.93 MiB

  • Tamanho do conjunto de dados : 4.46 MiB

  • Divisões :

Dividir Exemplos
'test' 2.021

Visualização

cifar10_1/v6

  • Descrição da configuração : É derivado de uma alocação de palavras-chave ligeiramente melhorada que é exatamente balanceada em classe. Esta versão do conjunto de dados corresponde aos resultados no Apêndice D do nosso artigo. v6 contém 2.000 imagens.

  • Tamanho do download : 5.87 MiB

  • Tamanho do conjunto de dados : 4.40 MiB

  • Divisões :

Dividir Exemplos
'test' 2.000

Visualização