Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

imagenet2012_fewshot

Descrição :

Imagenet2012Fewshot é um subconjunto do conjunto de dados ImageNet ILSVRC 2012 original. O conjunto de dados compartilha o mesmo conjunto de validação que o conjunto de dados ImageNet ILSVRC 2012 original. No entanto, o conjunto de treinamento é subamostrado de forma balanceada. Na configuração 5shot , são amostradas 5 imagens por etiqueta ou 5000 imagens; e na configuração 10shot , são amostradas 10 imagens por etiqueta ou 10.000 imagens.

Página inicial : http://image-net.org/
Código-fonte : tfds.datasets.imagenet2012_fewshot.Builder
Versões :
- 2.0.0 : Corrige rótulos de validação.
- 2.0.1 : Correção de codificação. Nenhuma mudança do ponto de vista do usuário.
- 3.0.0 : Corrige a coloração em ~12 imagens (CMYK -> RGB). Corrija o formato para consistência (converta a única imagem png em Jpeg). Leitura de geração mais rápida diretamente do arquivo.
- 4.0.0 : (não publicado)
- 5.0.0 : Nova API dividida ( https://tensorflow.org/datasets/splits )
- 5.0.1 (padrão): Sem notas de versão.
- 5.1.0 : Adicionado divisão de teste.
Tamanho do download : Unknown size
Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em https://image-net.org/download-images para obter o link para baixar o conjunto de dados.
Armazenado em cache automaticamente ( documentação ): Não
Estrutura de recursos :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Documentação do recurso :

Característica	Classe	Forma	Tipo D
	RecursosDict
nome do arquivo	Texto		corda
imagem	Imagem	(Nenhuma, Nenhuma, 3)	uint8
etiqueta	ClassLabel		int64

Chaves supervisionadas (Consulte as_supervised doc ): ('image', 'label')
Citação :

@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot (configuração padrão)

Descrição da configuração : 1 captura do conjunto de treinamento ImageNet total.
Tamanho do conjunto de dados : 6.46 GiB
Divisões :

Dividir	Exemplos
`'train'`	1.000
`'tune'`	1.000
`'validation'`	50.000

Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):

imagenet2012_fewshot/5shot

Descrição da configuração : 5 fotos do conjunto de treinamento ImageNet total.
Tamanho do conjunto de dados : 6.88 GiB
Divisões :

Dividir	Exemplos
`'train'`	5.000
`'tune'`	1.000
`'validation'`	50.000

Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):

imagenet2012_fewshot/10shot

Descrição da configuração : 10 disparos do conjunto de treinamento ImageNet total.
Tamanho do conjunto de dados : 7.42 GiB
Divisões :

Dividir	Exemplos
`'train'`	10.000
`'tune'`	1.000
`'validation'`	50.000

Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):

imagenet2012_fewshot Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

imagenet2012_fewshot/1shot (configuração padrão)

imagenet2012_fewshot/5shot

imagenet2012_fewshot/10shot

imagenet2012_fewshot