visual_domain_decathlon

  • Описание :

Он содержит 10 наборов данных, используемых в Visual Domain Decathlon, в рамках конкурса PASCAL in Detail Workshop Challenge (CVPR 2017). Целью этого задания является одновременное решение десяти задач классификации изображений, представляющих очень разные визуальные области.

Некоторые из включенных здесь наборов данных также доступны в виде отдельных наборов данных в TFDS. Однако обратите внимание, что изображения были предварительно обработаны для десятиборья Visual Domain (размер изменен изотропно, чтобы иметь меньший размер 72 пикселя) и могут иметь разные разделения обучения/проверки/тестирования. Здесь мы используем официальные сплиты для соревнований.

@ONLINE{hakanbilensylvestrerebuffitomasjakab2017,
    author = "Hakan Bilen, Sylvestre Rebuffi, Tomas Jakab",
    title  = "Visual Domain Decathlon",
    year   = "2017",
    url    = "https://www.robots.ox.ac.uk/~vgg/decathlon/"
}

visual_domain_decathlon/aircraft (конфигурация по умолчанию)

  • Описание конфигурации : данные основаны на «Самолете», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 20.96 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 3333
'train' 3334
'validation' 3333
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=100),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/cifar100

  • Описание конфигурации : данные основаны на «CIFAR-100», с изотропным изменением размера изображений, чтобы они имели более короткий размер 72 пикселя.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 119.43 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 10 000
'train' 40 000
'validation' 10 000
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=100),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/даймлерпедклс

  • Описание конфигурации : данные основаны на «Классификации пешеходов Daimler», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 68.35 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 19 600
'train' 23 520
'validation' 5880
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/dtd

  • Описание конфигурации : данные основаны на «описываемых текстурах», размеры изображений изменены изотропно, чтобы иметь более короткий размер 72 пикселя.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 13.30 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 1880
'train' 1880
'validation' 1880
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=47),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/gtsrb

  • Описание конфигурации : данные основаны на «Немецких дорожных знаках», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 80.58 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 12 630
'train' 31 367
'validation' 7842
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=43),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/imagenet12

  • Описание конфигурации : данные основаны на «Imagenet», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 6.11 GiB

  • Размер набора данных : 5.24 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплиты :

Расколоть Примеры
'test' 48 238
'train' 1 232 167
'validation' 49000
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/омниглот

  • Описание конфигурации : данные основаны на «Омниглоте», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 41.46 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 8115
'train' 17 853
'validation' 6492
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1623),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/svhn

  • Описание конфигурации : данные основаны на «номера домов в Просмотре улиц», размеры изображений изменены изотропно, чтобы их размер был меньше 72 пикселей.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 135.32 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 26 032
'train' 47 217
'validation' 26 040
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/ucf101

  • Описание конфигурации : данные основаны на «Динамических изображениях UCF101», размеры изображений изменены изотропно, чтобы иметь более короткий размер 72 пикселя.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 19.73 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 3783
'train' 7 585
'validation' 1952
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=101),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string

visual_domain_decathlon/vgg-цветы

  • Описание конфигурации : данные основаны на «VGG-Flowers», размеры изображений изменены изотропно, чтобы иметь более короткий размер 72 пикселя.

  • Размер загрузки : 409.94 MiB

  • Размер набора данных : 20.87 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 6149
'train' 1020
'validation' 1020
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=102),
    'name': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
этикетка Метка класса tf.int64
имя Текст tf.string