- Descrição :
Caltech-UCSD Birds 200 (CUB-200) é um conjunto de dados de imagens com fotos de 200 espécies de aves (principalmente norte-americanas). O número total de categorias de aves é 200 e há 6.033 imagens no conjunto de dados de 2010 e 11.788 imagens no conjunto de dados de 2011. As anotações incluem caixas delimitadoras e rótulos de segmentação.
Documentação Adicional : Explore em Papers With Code
Homepage : http://www.vision.caltech.edu/visipedia/CUB-200.html
Código -fonte:
tfds.image_classification.CaltechBirds2011
Versões :
-
0.1.1
(padrão): sem notas de versão.
-
Tamanho do download :
1.11 GiB
Tamanho do conjunto de dados :
1.11 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.794 |
'train' | 5.994 |
- Estrutura de recursos :
FeaturesDict({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=200),
'label_name': Text(shape=(), dtype=string),
'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
bbox | Recurso BBox | (4,) | float32 | |
imagem | Imagem | (Nenhuma, Nenhuma, 3) | uint8 | |
imagem/nome do arquivo | Texto | corda | ||
etiqueta | ClassLabel | int64 | ||
nome do rótulo | Texto | corda | ||
segmentation_mask | Imagem | (Nenhuma, Nenhuma, 1) | uint8 |
Chaves supervisionadas (Consulte
as_supervised
doc ):('image', 'label')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@techreport{WelinderEtal2010,
Author = {P. Welinder and S. Branson and T. Mita and C. Wah and F. Schroff and S. Belongie and P. Perona},
Institution = {California Institute of Technology},
Number = {CNS-TR-2010-001},
Title = { {Caltech-UCSD Birds 200} },
Year = {2010}
}