- وصف :
مجموعة بيانات Oxford-IIIT للحيوانات الأليفة عبارة عن مجموعة بيانات لصور الحيوانات الأليفة مكونة من 37 فئة مع ما يقرب من 200 صورة لكل فئة. تحتوي الصور على اختلافات كبيرة في الحجم والوضع والإضاءة. تحتوي جميع الصور على شرح توضيحي للحقيقة الأساسية للسلالة والأنواع. بالإضافة إلى ذلك، يتم توفير مربعات محيطة بالرأس لتقسيم التدريب، مما يسمح باستخدام مجموعة البيانات هذه لمهام اكتشاف الكائنات البسيطة. في تقسيم الاختبار، تكون المربعات المحيطة فارغة.
وثائق إضافية : استكشف الأوراق ذات الكود
الصفحة الرئيسية : http://www.robots.ox.ac.uk/~vgg/data/pets/
كود المصدر :
tfds.datasets.oxford_iiit_pet.Builder
الإصدارات :
-
4.0.0
(افتراضي) : إضافة مربعات محيطة بالرأس. إصلاح الصور الفاسدة. تحديث عنوان URL لمجموعة البيانات.
-
حجم التحميل :
773.52 MiB
حجم مجموعة البيانات :
773.68 MiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 3,669 |
'train' | 3,680 |
- هيكل الميزة :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
file_name | نص | خيط | ||
head_bbox | ميزة BBox | (4،) | float32 | |
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
ملصق | ClassLabel | int64 | ||
تجزئة_قناع | صورة | (لا شيء، لا شيء، 1) | uint8 | |
صِنف | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):('image', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@InProceedings{parkhi12a,
author = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
title = "Cats and Dogs",
booktitle = "IEEE Conference on Computer Vision and Pattern Recognition",
year = "2012",
}