open_images_challenge2019_detection

Open Images یک انتشار مشترک از 9 میلیون تصویر است که با برچسب‌های سطح تصویر، جعبه‌های محدودکننده اشیا، ماسک‌های تقسیم‌بندی اشیا و روابط بصری حاشیه‌نویسی شده‌اند. این مجموعه داده منحصر به فرد بزرگ و متنوع برای ایجاد پیشرفت های پیشرفته در تجزیه و تحلیل و درک تصاویر طراحی شده است.

این شامل داده‌های مربوط به مسیر تشخیص شیء مسابقه است. هدف در این مسیر پیش‌بینی یک جعبه محدود در اطراف همه نمونه‌های شی از 500 کلاس است.

تصاویر با برچسب‌های سطح تصویر مثبت حاشیه‌نویسی می‌شوند، که نشان می‌دهد کلاس‌های شی خاصی وجود دارد، و با برچسب‌های سطح تصویر منفی، نشان می‌دهد که کلاس‌های خاصی وجود ندارند. در مسابقه، تمام کلاس‌های بدون حاشیه‌نویسی دیگر از ارزیابی در آن تصویر حذف می‌شوند. برای هر برچسب مثبت سطح تصویر در یک تصویر، هر نمونه از آن کلاس شی در تصویر حاشیه نویسی می شد.

شکاف مثال ها
'test' 99,999
'train' 1,743,042
'validation' 41620
  • ساختار ویژگی :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
بابجکت ها توالی
bobjects/bbox ویژگی BBox (4،) float32
bobjects/is_group_of تانسور بوول
bobjects/برچسب ClassLabel int64
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 3) uint8
اشیاء توالی
اشیاء / اعتماد به نفس تانسور float32
اشیاء/برچسب ClassLabel int64
اشیاء/منبع متن رشته
  • کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None

  • نقل قول :

open_images_challenge2019_detection/200k (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : تصاویر دارای حداکثر 200000 پیکسل با کیفیت 72 JPEG هستند.

  • حجم مجموعه داده : 59.06 GiB

  • شکل ( tfds.show_examples ):

تجسم

open_images_challenge2019_detection/300k

  • توضیحات پیکربندی : تصاویر دارای حداکثر 300000 پیکسل با کیفیت 72 JPEG هستند.

  • حجم مجموعه داده : 80.10 GiB

  • شکل ( tfds.show_examples ):

تجسم