imagenet2012_subset

Imagenet2012Subset é um subconjunto do conjunto de dados ImageNet ILSVRC 2012 original. O conjunto de dados compartilha o mesmo conjunto de validação que o conjunto de dados ImageNet ILSVRC 2012 original. No entanto, o conjunto de treinamento é subamostrado de forma balanceada. Na configuração 1pct , 1%, ou 12811, as imagens são amostradas, a maioria das classes tem o mesmo número de imagens (média de 12,8), algumas classes aleatoriamente têm 1 exemplo a mais que outras; e na configuração 10pct , ~10%, ou 128116, a maioria das classes tem o mesmo número de imagens (média de 128), e algumas classes aleatoriamente têm 1 exemplo a mais do que outras.

Isso deve ser usado como referência para aprendizado semi-supervisionado e foi originalmente usado no documento SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Página inicial : http://image-net.org/

  • Código-fonte : tfds.datasets.imagenet2012_subset.Builder

  • Versões :

    • 2.0.0 : Corrige rótulos de validação.
    • 2.0.1 : Correção de codificação. Nenhuma mudança do ponto de vista do usuário.
    • 3.0.0 : Corrige a coloração em ~12 imagens (CMYK -> RGB). Corrija o formato para consistência (converta a única imagem png em Jpeg). Leitura de geração mais rápida diretamente do arquivo.

    • 4.0.0 : (não publicado)

    • 5.0.0 (padrão): Nova API de divisão ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Adicionado divisão de teste.

  • Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em https://image-net.org/download-images para obter o link para baixar o conjunto de dados.

  • Armazenado em cache automaticamente ( documentação ): Não

  • Estrutura de recursos :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentação do recurso :
Característica Classe Forma Tipo D Descrição
RecursosDict
nome do arquivo Texto corda
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
  • Chaves supervisionadas (Consulte as_supervised doc ): ('image', 'label')

  • Citação :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configuração padrão)

  • Descrição da configuração : 1pct do conjunto de treinamento ImageNet total.

  • Tamanho do download : 254.22 KiB

  • Tamanho do conjunto de dados : 7.61 GiB

  • Divisões :

Dividir Exemplos
'train' 12.811
'validation' 50.000

Visualização

imagenet2012_subset/10pct

  • Descrição da configuração : 10% do conjunto de treinamento ImageNet total.

  • Tamanho do download : 2.48 MiB

  • Tamanho do conjunto de dados : 19.91 GiB

  • Divisões :

Dividir Exemplos
'train' 128.116
'validation' 50.000

Visualização