- Descrição :
O conjunto de dados de animais de estimação Oxford-IIIT é um conjunto de dados de imagens de animais de estimação de 37 categorias com cerca de 200 imagens para cada classe. As imagens apresentam grandes variações de escala, pose e iluminação. Todas as imagens têm uma anotação de verdade associada de raça e espécie. Além disso, caixas delimitadoras de cabeçalho são fornecidas para a divisão de treinamento, permitindo o uso deste conjunto de dados para tarefas simples de detecção de objetos. Na divisão de teste, as caixas delimitadoras estão vazias.
Documentação adicional : Explore artigos com código
Página inicial : http://www.robots.ox.ac.uk/~vgg/data/pets/
Código fonte :
tfds.datasets.oxford_iiit_pet.Builder
Versões :
-
4.0.0
(padrão) : Adicione caixas delimitadoras de cabeça. Corrija imagens corrompidas. Atualizar URL do conjunto de dados.
-
Tamanho do download :
773.52 MiB
Tamanho do conjunto de dados :
773.68 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 3.669 |
'train' | 3.680 |
- Estrutura de recursos :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
nome_do_arquivo | Texto | corda | ||
head_bbox | BBoxFeature | (4,) | float32 | |
imagem | Imagem | (Nenhum, Nenhum, 3) | uint8 | |
rótulo | ClassLabel | int64 | ||
máscara_de_segmentação | Imagem | (Nenhum, Nenhum, 1) | uint8 | |
espécies | ClassLabel | int64 |
Chaves supervisionadas (consulte o documento
as_supervised
):('image', 'label')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ): Ausente.
Citação :
@InProceedings{parkhi12a,
author = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
title = "Cats and Dogs",
booktitle = "IEEE Conference on Computer Vision and Pattern Recognition",
year = "2012",
}