oxford_iiit_pet

  • Description :

L'ensemble de données sur les animaux de compagnie Oxford-IIIT est un ensemble de données d'images d'animaux de compagnie de 37 catégories avec environ 200 images pour chaque classe. Les images présentent de grandes variations d’échelle, de pose et d’éclairage. Toutes les images sont associées à une annotation de vérité terrain sur la race et l’espèce. De plus, des cadres de délimitation de tête sont fournis pour la répartition de la formation, permettant d'utiliser cet ensemble de données pour des tâches simples de détection d'objets. Dans la division de test, les cadres de délimitation sont vides.

Diviser Exemples
  • Structure des fonctionnalités :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
nom de fichier Texte chaîne
head_bbox Fonctionnalité BBox (4,) flotteur32
image Image (Aucun, Aucun, 3) uint8
étiquette Étiquette de classe int64
masque_segmentation Image (Aucun, Aucun, 1) uint8
espèces Étiquette de classe int64
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}