голос

  • Описание :

Этот набор данных содержит данные конкурса PASCAL Visual Object Classes Challenge, соответствующие соревнованиям по классификации и обнаружению.

В соревновании по классификации цель состоит в том, чтобы предсказать набор меток, содержащихся в изображении, в то время как в соревновании по обнаружению цель состоит в том, чтобы предсказать ограничивающую рамку и метку каждого отдельного объекта. ВНИМАНИЕ: Согласно официальному набору данных, тестовый набор VOC2012 не содержит аннотаций.

  • Исходный код : tfds.object_detection.Voc

  • Версии :

    • 4.0.0 (по умолчанию): нет примечаний к выпуску.
  • Размер набора данных : Unknown size

  • Автокэширование ( документация ): неизвестно

  • Структура функции :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_difficult': tf.bool,
        'is_truncated': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    }),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
изображение/имя файла Текст tf.string
этикетки Последовательность (метка класса) (Никто,) tf.int64
labels_no_difficult Последовательность (метка класса) (Никто,) tf.int64
объекты Последовательность
объекты/bbox BBoxFeature (4,) tf.float32
объекты/is_difficult Тензор tf.bool
объекты/is_truncated Тензор tf.bool
объекты/метка Метка класса tf.int64
объекты/поза Метка класса tf.int64

voc/2007 (конфигурация по умолчанию)

  • Описание конфигурации : этот набор данных содержит данные конкурса PASCAL Visual Object Classes Challenge 2007, также известного как VOC2007.

Всего в этот набор данных включено 9963 изображения, где каждое изображение содержит набор объектов из 20 различных классов, что составляет в общей сложности 24640 аннотированных объектов.

Расколоть Примеры
'test' 4952
'train' 2501
'validation' 2510
  • Цитата :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

голос/2012

  • Описание конфигурации : этот набор данных содержит данные конкурса PASCAL Visual Object Classes Challenge 2012, также известного как VOC2012.

Всего в этот набор данных включено 11540 изображений, где каждое изображение содержит набор объектов из 20 различных классов, что в сумме составляет 27450 аннотированных объектов.

Расколоть Примеры
'test' 10 991
'train' 5717
'validation' 5823
  • Цитата :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}