دسبريتس

dSprites عبارة عن مجموعة بيانات من الأشكال ثنائية الأبعاد تم إنشاؤها إجرائيًا من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي اللون والشكل والمقياس والدوران ومواضع x و y للكائن.

جميع التركيبات الممكنة لهذه الكمون موجودة مرة واحدة بالضبط ، مما يؤدي إلى توليد N = 737280 إجمالي الصور.

قيم العامل الكامن

  • اللون الابيض
  • الشكل: مربع ، القطع الناقص ، القلب
  • المقياس: 6 قيم متباعدة خطيًا في [0.5 ، 1]
  • الاتجاه: 40 قيمة في [0 ، 2 بي]
  • الموضع X: 32 قيمة في [0 ، 1]
  • الموضع ص: 32 قيمة في [0 ، 1]

قمنا بتغيير واحد كامن في كل مرة (بدءًا من الموضع Y ، ثم الموضع X ، إلخ) ، وقمنا بتخزين الصور بترتيب ثابت. ومن ثم يكون الترتيب على طول البعد الأول ثابتًا ويسمح لك بالرجوع إلى قيمة العناصر الكامنة المقابلة لتلك الصورة.

لقد اخترنا قيم الكامنة عن عمد لإجراء تغييرات أصغر في الخطوات مع ضمان اختلاف جميع مخرجات البكسل. لم يتم إضافة ضجيج.

انشق، مزق أمثلة
'train' 737280
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة صورة (64 ، 64 ، 1) uint8
التسمية_التوجيه ClassLabel int64
مقياس_المسمية ClassLabel int64
التسمية_شكل ClassLabel int64
label_x_position ClassLabel int64
التسمية_y_position ClassLabel int64
التوجه قيمة موتر تعويم 32
مقياس القيمة موتر تعويم 32
شكل_قيمة موتر تعويم 32
القيمة_x_position موتر تعويم 32
القيمة_ص_الوضعية موتر تعويم 32

التصور

  • الاقتباس :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}