oxford_iit_pet

  • Descrizione :

Il set di dati sugli animali domestici Oxford-IIIT è un set di dati di immagini di animali domestici di 37 categorie con circa 200 immagini per ciascuna classe. Le immagini presentano grandi variazioni di scala, posa e illuminazione. A tutte le immagini è associata un'annotazione di razza e specie. Inoltre, vengono forniti riquadri di delimitazione della testa per la suddivisione dell'addestramento, consentendo l'utilizzo di questo set di dati per semplici attività di rilevamento di oggetti. Nella suddivisione del test, i riquadri di delimitazione sono vuoti.

Diviso Esempi
'test' 3.669
'train' 3.680
  • Struttura delle caratteristiche :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
nome_file Testo corda
head_bbox Funzione BBox (4,) float32
immagine Immagine (Nessuno, Nessuno, 3) uint8
etichetta ClassLabel int64
segmentation_mask Immagine (Nessuno, Nessuno, 1) uint8
specie ClassLabel int64
  • Citazione :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}