فليك

  • وصف :

من الورقة: قمنا بجمع مجموعة بيانات مكونة من 5003 صورة تلقائيًا من أفلام هوليود الشهيرة. تم الحصول على الصور عن طريق تشغيل جهاز كشف الأشخاص المتطور في كل إطار عاشر من 30 فيلمًا. تم بعد ذلك إرسال الأشخاص الذين تم اكتشافهم بثقة عالية (حوالي 20 ألف مرشح) إلى سوق التعهيد الجماعي Amazon Mechanical Turk للحصول على العلامات الحقيقية. تمت إضافة تعليقات توضيحية لكل صورة بواسطة خمسة من الأتراك مقابل 0.01 دولار لكل صورة لتسمية 10 مفاصل الجزء العلوي من الجسم. تم أخذ العلامة المتوسطة من أصل خمسة في كل صورة لتكون قوية بالنسبة للتعليقات التوضيحية الخارجية. أخيرًا، تم رفض الصور يدويًا من قبلنا إذا كان الشخص محجوبًا أو غير أمامي بشدة. لقد خصصنا 20٪ (1016 صورة) من البيانات للاختبار.

ينقسم أمثلة
'test' 1,016
'train' 3,987
  • هيكل الميزة :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
com.currframe الموتر float64
صورة صورة (480، 720، 3) uint8
اسم الفيلم نص خيط
poselet_hit_idx التسلسل (الموتر) (لا أحد،) uint16
com.torsobox ميزة BBox (4،) float32
com.xcoords التسلسل (الموتر) (لا أحد،) float64
ycoords التسلسل (الموتر) (لا أحد،) float64
  • المفاتيح الخاضعة للإشراف (راجع as_supervised doc ): None

  • الاقتباس :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

فليك/صغير (التكوين الافتراضي)

  • وصف التكوين : يستخدم 5003 أمثلة مستخدمة في ورق CVPR13 MODEC.

  • حجم التحميل : 286.35 MiB

  • الشكل ( tfds.show_examples ):

التصور

فليك/كامل

  • وصف التكوين : يستخدم 20928 مثالًا، وهي مجموعة شاملة من FLIC تتكون من أمثلة أكثر صعوبة.

  • حجم التحميل : 1.10 GiB

  • الشكل ( tfds.show_examples ):

التصور