флик

Из статьи: Мы автоматически собрали набор данных из 5003 изображений из популярных голливудских фильмов. Изображения были получены путем запуска современного детектора лиц на каждом десятом кадре из 30 видеороликов. Люди, обнаруженные с высокой степенью достоверности (примерно 20 тысяч кандидатов), затем были отправлены на краудсорсинговую площадку Amazon Mechanical Turk для получения маркировки достоверности. Каждое изображение было аннотировано пятью туркерами по 0,01 доллара каждый, чтобы пометить 10 суставов верхней части тела. На каждом изображении была взята маркировка по медиане из пяти, чтобы она была устойчивой к аннотации выбросов. Наконец, изображения были отклонены нами вручную, если человек был закрыт или сильно не фронтальный. Мы отложили 20% (1016 изображений) данных для тестирования.

Расколоть Примеры
'test' 1016
'train' 3987
  • Структура функции :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
каркас Тензор tf.float64
изображение Изображение (480, 720, 3) tf.uint8
название фильма Текст tf.string
poselet_hit_idx Последовательность (тензор) (Никто,) tf.uint16
торсбокс BBoxFeature (4,) tf.float32
координаты Последовательность (тензор) (Никто,) tf.float64
координаты Последовательность (тензор) (Никто,) tf.float64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (конфигурация по умолчанию)

  • Описание конфигурации : Использует 5003 примера, использованных в документе CVPR13 MODEC.

  • Размер загрузки : 286.35 MiB

флик/полный

  • Описание конфигурации : использует 20928 примеров, надмножество FLIC, состоящее из более сложных примеров.

  • Размер загрузки : 1.10 GiB