open_images_challenge2019_detection

  • وصف :

يعد Open Images إصدارًا تعاونيًا يضم حوالي 9 ملايين صورة مع تعليقات توضيحية بتسميات على مستوى الصورة، ومربعات محيطة بالكائن، وأقنعة تجزئة الكائن، والعلاقات المرئية. تم تصميم مجموعة البيانات الكبيرة والمتنوعة هذه لتحفيز أحدث التطورات في تحليل الصور وفهمها.

يحتوي هذا على البيانات من مسار اكتشاف الأشياء الخاص بالمنافسة. الهدف في هذا المسار هو التنبؤ بمربع محيط محكم حول جميع مثيلات الكائنات المكونة من 500 فئة.

يتم وضع تعليقات توضيحية على الصور باستخدام تسميات إيجابية على مستوى الصورة، مما يشير إلى وجود فئات معينة من الكائنات، ومع تسميات سلبية على مستوى الصورة، تشير إلى غياب فئات معينة. في المسابقة، يتم استبعاد جميع الفئات الأخرى غير المشروحة من التقييم في تلك الصورة. بالنسبة لكل تسمية إيجابية على مستوى الصورة في الصورة، تمت إضافة تعليق توضيحي لكل مثيل لفئة الكائن في الصورة.

ينقسم أمثلة
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • هيكل الميزة :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
كائنات تسلسل
كائنات/بي بوكس ميزة BBox (4،) float32
bobjects/is_group_of الموتر منطقي
الكائنات/التسمية ClassLabel int64
بطاقة تعريف نص خيط
صورة صورة (لا شيء، لا شيء، 3) uint8
أشياء تسلسل
الأشياء/الثقة الموتر float32
الكائنات/التسمية ClassLabel int64
الكائنات/المصدر نص خيط
  • المفاتيح الخاضعة للإشراف (راجع as_supervised doc ): None

  • الاقتباس :

open_images_challenge2019_detection/200 كيلو (التكوين الافتراضي)

  • وصف التكوين : تحتوي الصور على 200000 بكسل على الأكثر وبجودة 72 JPEG.

  • حجم مجموعة البيانات : 59.06 GiB

  • الشكل ( tfds.show_examples ):

التصور

open_images_challenge2019_detection/300k

  • وصف التكوين : تحتوي الصور على 300000 بكسل على الأكثر وبجودة 72 JPEG.

  • حجم مجموعة البيانات : 80.10 GiB

  • الشكل ( tfds.show_examples ):

التصور