สไปรต์

  • คำอธิบาย :

dSprites คือชุดข้อมูลของรูปร่าง 2 มิติที่สร้างขึ้นตามขั้นตอนจากปัจจัยแฝงที่เป็นอิสระจากความจริงภาคพื้นดิน 6 ปัจจัย ปัจจัยเหล่านี้ ได้แก่ สี รูปร่าง ขนาด การหมุน ตำแหน่ง x และ y ของสไปรท์

การรวมกันที่เป็นไปได้ทั้งหมดของค่าแฝงเหล่านี้จะแสดงเพียงครั้งเดียว ทำให้เกิดภาพทั้งหมด N = 737280

ค่าปัจจัยแฝง

  • สี: ขาว
  • รูปร่าง: สี่เหลี่ยม วงรี หัวใจ
  • สเกล: 6 ค่าโดยเว้นระยะห่างเชิงเส้นใน [0.5, 1]
  • การวางแนว: 40 ค่าใน [0, 2 pi]
  • ตำแหน่ง X: 32 ค่าใน [0, 1]
  • ตำแหน่ง Y: 32 ค่าใน [0, 1]

เราเปลี่ยนแปลงค่าแฝงในแต่ละครั้ง (เริ่มจากตำแหน่ง Y จากนั้นตำแหน่ง X เป็นต้น) และจัดเก็บรูปภาพตามลำดับตามลำดับคงที่ ดังนั้นลำดับตามมิติแรกจึงได้รับการแก้ไข และช่วยให้คุณสามารถแมปกลับไปยังค่าของค่าแฝงที่สอดคล้องกับรูปภาพนั้นได้

เราเลือกค่าแฝงโดยเจตนาเพื่อให้มีการเปลี่ยนแปลงขั้นตอนที่น้อยที่สุด ในขณะเดียวกันก็ทำให้มั่นใจได้ว่าเอาต์พุตพิกเซลทั้งหมดจะแตกต่างกัน ไม่มีเสียงรบกวนเพิ่ม

แยก ตัวอย่าง
'train' 737,280
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (64, 64, 1) uint8
label_orientation ClassLabel int64
label_scale ClassLabel int64
label_shape ClassLabel int64
label_x_position ClassLabel int64
label_y_position ClassLabel int64
ค่า_การวางแนว เทนเซอร์ ลอย32
ค่า_ขนาด เทนเซอร์ ลอย32
ค่า_รูปร่าง เทนเซอร์ ลอย32
ค่า_x_ตำแหน่ง เทนเซอร์ ลอย32
ค่า_y_ตำแหน่ง เทนเซอร์ ลอย32

การแสดงภาพ

  • การอ้างอิง :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}