dsprites

dSprites เป็นชุดข้อมูลของรูปทรง 2 มิติที่สร้างขึ้นตามขั้นตอนจากปัจจัยแฝงที่ไม่ขึ้นกับความจริงพื้นฐาน 6 ประการ ปัจจัยเหล่านี้มีสีรูปร่าง, ขนาด, การหมุนตำแหน่ง x และ y ที่ของเทพดา

ชุดค่าผสมที่เป็นไปได้ทั้งหมดของเวลาแฝงเหล่านี้จะแสดงเพียงครั้งเดียว ทำให้เกิดภาพทั้งหมด N = 737280

ค่าปัจจัยแฝง

  • สี: ขาว
  • รูปร่าง: สี่เหลี่ยม วงรี หัวใจ
  • มาตราส่วน: 6 ค่าที่เว้นระยะเชิงเส้นใน [0.5, 1]
  • การวางแนว: 40 ค่าใน [0, 2 pi]
  • ตำแหน่ง X: 32 ค่าใน [0, 1]
  • ตำแหน่ง Y: 32 ค่าใน [0, 1]

เราเปลี่ยนภาพแฝงในแต่ละครั้ง (เริ่มจากตำแหน่ง Y จากนั้นจึงเปลี่ยนตำแหน่ง X เป็นต้น) และจัดเก็บภาพตามลำดับคงที่ ดังนั้น ลำดับของมิติแรกจึงได้รับการแก้ไข และอนุญาตให้คุณแมปกลับไปยังค่าของเวลาแฝงที่สัมพันธ์กับภาพนั้น

เราเลือกค่าแฝงโดยเจตนาเพื่อให้มีการเปลี่ยนแปลงขั้นตอนที่เล็กที่สุดในขณะที่ตรวจสอบให้แน่ใจว่าเอาต์พุตพิกเซลทั้งหมดแตกต่างกัน ไม่มีเสียงรบกวน

แยก ตัวอย่าง
'train' 737,280
  • คุณสมบัติ:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

การสร้างภาพ

  • อ้างอิง:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}