פליק

מתוך העיתון: אספנו מערך תמונות של 5003 באופן אוטומטי מסרטים הוליוודיים פופולריים. התמונות התקבלו על ידי הפעלת גלאי אדם חדיש על כל פריים עשירי של 30 סרטים. אנשים שזוהו בביטחון רב (בערך 20,000 מועמדים) נשלחו לאחר מכן לשוק מיקור ההמונים Amazon Mechanical Turk כדי להשיג תיוג אמת. כל תמונה סומנה על ידי חמישה טורקים תמורת 0.01 דולר כל אחד כדי לסמן 10 מפרקי פלג גוף עליון. התיוג החציוני מבין חמש צולם בכל תמונה כדי להיות חזק להערות חריגות. לבסוף, תמונות נדחו על ידינו באופן ידני אם האדם היה חסום או לא פרונטלי בצורה חמורה. אנו מפרישים 20% (1016 תמונות) מהנתונים לבדיקה.

לְפַצֵל דוגמאות
'test' 1,016
'train' 3,987
  • מבנה תכונה :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
currframe מוֹתֵחַ לצוף64
תמונה תמונה (480, 720, 3) uint8
שם הסרט טֶקסט חוּט
poselet_hit_idx רצף (טנזור) (אף אחד,) uint16
טורסובוקס BBoxFeature (4,) לצוף32
xcoords רצף (טנזור) (אף אחד,) לצוף64
ycoords רצף (טנזור) (אף אחד,) לצוף64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (תצורת ברירת מחדל)

  • תיאור תצורה : משתמש ב-5003 דוגמאות המשמשות בנייר CVPR13 MODEC.

  • גודל הורדה : 286.35 MiB

  • איור ( tfds.show_examples ):

רְאִיָה

פליק/מלא

  • תיאור תצורה : משתמש ב-20928 דוגמאות, ערכת-על של FLIC המורכבת מדוגמאות קשות יותר.

  • גודל הורדה : 1.10 GiB

  • איור ( tfds.show_examples ):

רְאִיָה