s3o4d

مجموعة البيانات التي تم وصفها لأول مرة في قسم "كائنات ستانفورد ثلاثية الأبعاد" من الورقة Disentangling by Subspace Diffusion . تتكون البيانات من 100000 عرض لكل من كائنات الأرنب والتنين من مستودع ستانفورد للمسح الضوئي ثلاثي الأبعاد . يمكن إضافة المزيد من العناصر في المستقبل ، ولكن يتم استخدام الأرنب والتنين فقط في الورق. يتم تقديم كل كائن بإضاءة ذات عينات موحدة من نقطة على 2-sphere ، ودوران ثلاثي الأبعاد بشكل موحد. يتم توفير الحالات الكامنة الحقيقية كمصفوفات NumPy جنبًا إلى جنب مع الصور. يتم إعطاء الإضاءة كمتجه ثلاثي مع معيار الوحدة ، بينما يتم توفير الدوران على شكل رباعي ومصفوفة متعامدة 3 × 3.

هناك العديد من أوجه التشابه بين S3O4D ومجموعات البيانات المعيارية الحالية لـ ML مثل NORB ، والكراسي ثلاثية الأبعاد ، والأشكال ثلاثية الأبعاد وغيرها الكثير ، والتي تتضمن أيضًا عروض لمجموعة من الكائنات في ظروف مختلفة وظروف الإضاءة. ومع ذلك ، لا تتضمن أي من مجموعات البيانات الحالية هذه المجموعة الكاملة من التدويرات ثلاثية الأبعاد - معظمها لا يتضمن سوى مجموعة فرعية من التغييرات في الارتفاع والسمت. يتم أخذ عينات من صور S3O4D بشكل موحد ومستقل عن المساحة الكاملة للتدوير والإضاءة ، مما يعني أن مجموعة البيانات تحتوي على كائنات مقلوبة ومضاءة من الخلف أو من أسفل. نعتقد أن هذا يجعل S3O4D مناسبًا بشكل فريد للبحث في النماذج التوليدية حيث يكون للفضاء الكامن طوبولوجيا غير تافهة ، وكذلك لطرق التعلم العامة المتنوعة حيث يكون انحناء المنوع مهمًا.

انشق، مزق أمثلة
'bunny_test' 20000
'bunny_train' 80000
'dragon_test' 20000
'dragon_train' 80000
  • هيكل الميزة :
FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=float32),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=float32),
    'pose_quat': Tensor(shape=(4,), dtype=float32),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
إضاءة موتر (3 ،) تعويم 32
صورة صورة (256 ، 256 ، 3) uint8
ضع الكلمة المناسبة ClassLabel int64
بوز_مات موتر (3 ، 3) تعويم 32
pose_quat موتر (4 ،) تعويم 32

التصور

  • الاقتباس :
@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}