oxford_iiit_pet

  • وصف :

مجموعة بيانات Oxford-IIIT للحيوانات الأليفة عبارة عن مجموعة بيانات لصور الحيوانات الأليفة مكونة من 37 فئة مع ما يقرب من 200 صورة لكل فئة. تحتوي الصور على اختلافات كبيرة في الحجم والوضع والإضاءة. تحتوي جميع الصور على شرح توضيحي للحقيقة الأساسية للسلالة والأنواع. بالإضافة إلى ذلك، يتم توفير مربعات محيطة بالرأس لتقسيم التدريب، مما يسمح باستخدام مجموعة البيانات هذه لمهام اكتشاف الكائنات البسيطة. في تقسيم الاختبار، تكون المربعات المحيطة فارغة.

ينقسم أمثلة
'test' 3,669
'train' 3,680
  • هيكل الميزة :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
file_name نص خيط
head_bbox ميزة BBox (4،) float32
صورة صورة (لا شيء، لا شيء، 3) uint8
ملصق ClassLabel int64
تجزئة_قناع صورة (لا شيء، لا شيء، 1) uint8
صِنف ClassLabel int64
  • الاقتباس :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}