спрайты

  • Описание :

dSprites — это набор данных двумерных фигур, процедурно сгенерированных из шести независимых скрытых факторов. Этими факторами являются цвет , форма , масштаб , вращение , положения спрайта по осям x и y .

Все возможные комбинации этих латентных изображений присутствуют ровно один раз, что дает общее количество N = 737280 изображений.

Значения скрытого фактора

  • Белый цвет
  • Форма: квадрат, эллипс, сердце.
  • Масштаб: 6 значений, линейно расположенных в [0,5, 1]
  • Ориентация: 40 значений в [0, 2 pi]
  • Позиция X: 32 значения в [0, 1]
  • Позиция Y: 32 значения в [0, 1]

Мы меняли один латент за раз (начиная с позиции Y, затем позиции X и т. д.) и последовательно сохраняли изображения в фиксированном порядке. Следовательно, порядок по первому измерению фиксирован и позволяет вам сопоставить обратное значение скрытых значений, соответствующих этому изображению.

Мы намеренно выбрали скрытые значения, чтобы изменения были наименьшими, но при этом гарантировали, что все выходные данные пикселей будут разными. Никакого шума не добавилось.

Расколоть Примеры
'train' 737 280
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (64, 64, 1) uint8
label_orientation Класслейбл int64
label_scale Класслейбл int64
label_shape Класслейбл int64
label_x_position Класслейбл int64
label_y_position Класслейбл int64
значение_ориентация Тензор поплавок32
шкала_значения Тензор поплавок32
value_shape Тензор поплавок32
value_x_position Тензор поплавок32
value_y_position Тензор поплавок32

Визуализация

  • Цитата :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}