visual_domain_decathlon

  • Descrição :

Este contém os 10 conjuntos de dados usados ​​no Visual Domain Decathlon, parte do PASCAL in Detail Workshop Challenge (CVPR 2017). O objetivo deste desafio é resolver simultaneamente dez problemas de classificação de imagens representativos de domínios visuais muito diferentes.

Alguns dos conjuntos de dados incluídos aqui também estão disponíveis como conjuntos de dados separados no TFDS. No entanto, observe que as imagens foram pré-processadas para o Visual Domain Decathlon (redimensionadas isotropicamente para ter um tamanho menor de 72 pixels) e podem ter diferentes divisões de treinamento/validação/teste. Aqui usamos as divisões oficiais da competição.

@ONLINE{hakanbilensylvestrerebuffitomasjakab2017,
    author = "Hakan Bilen, Sylvestre Rebuffi, Tomas Jakab",
    title  = "Visual Domain Decathlon",
    year   = "2017",
    url    = "https://www.robots.ox.ac.uk/~vgg/decathlon/"
}

visual_domain_decathlon/aircraft (configuração padrão)

  • Descrição da configuração : Dados baseados em "Aircraft", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 20.96 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 3.333
'train' 3.334
'validation' 3.333
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/cifar100

  • Descrição da configuração : Dados baseados em "CIFAR-100", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 119.43 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 10.000
'train' 40.000
'validation' 10.000
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/daimlerpedcls

  • Descrição da configuração : Dados baseados na "Classificação de pedestres Daimler", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 68.35 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 19.600
'train' 23.520
'validation' 5.880
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/dtd

  • Descrição da configuração : Dados baseados em "Texturas Descritíveis", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 13.30 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 1.880
'train' 1.880
'validation' 1.880
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/gtsrb

  • Descrição da configuração : Dados baseados em "Sinais de trânsito alemães", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 80.58 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 12.630
'train' 31.367
'validation' 7.842
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=43),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/imagenet12

  • Descrição da configuração : Dados baseados em "Imagenet", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 6.11 GiB

  • Tamanho do conjunto de dados : 5.24 GiB

  • Armazenado em cache automaticamente ( documentação ): Não

  • Divisões :

Dividir Exemplos
'test' 48.238
'train' 1.232.167
'validation' 49.000
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/omniglot

  • Descrição da configuração : Dados baseados em "Omniglot", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 41.46 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 8.115
'train' 17.853
'validation' 6.492
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1623),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/svhn

  • Descrição da configuração : Dados baseados em "Street View House Numbers", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 135.32 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 26.032
'train' 47.217
'validation' 26.040
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/ucf101

  • Descrição da configuração : Dados baseados em "UCF101 Dynamic Images", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 19.73 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 3.783
'train' 7.585
'validation' 1.952
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização

visual_domain_decathlon/vgg-flowers

  • Descrição da configuração : Dados baseados em "VGG-Flowers", com imagens redimensionadas isotropicamente para ter um tamanho menor de 72 pixels.

  • Tamanho do download : 409.94 MiB

  • Tamanho do conjunto de dados : 20.87 MiB

  • Cache automático ( documentação ): Sim

  • Divisões :

Dividir Exemplos
'test' 6.149
'train' 1.020
'validation' 1.020
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
    'name': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
etiqueta ClassLabel int64
nome Texto corda

Visualização