التصور : استكشف في اعرف بياناتك
الوصف :
dSprites عبارة عن مجموعة بيانات من الأشكال ثنائية الأبعاد تم إنشاؤها إجرائيًا من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي اللون والشكل والمقياس والدوران ومواضع x و y للكائن.
جميع التركيبات الممكنة لهذه الكمون موجودة مرة واحدة بالضبط ، مما يؤدي إلى توليد N = 737280 إجمالي الصور.
قيم العامل الكامن
- اللون الابيض
- الشكل: مربع ، القطع الناقص ، القلب
- المقياس: 6 قيم متباعدة خطيًا في [0.5 ، 1]
- الاتجاه: 40 قيمة في [0 ، 2 بي]
- الموضع X: 32 قيمة في [0 ، 1]
- الموضع ص: 32 قيمة في [0 ، 1]
قمنا بتغيير واحد كامن في كل مرة (بدءًا من الموضع Y ، ثم الموضع X ، إلخ) ، وقمنا بتخزين الصور بترتيب ثابت. ومن ثم يكون الترتيب على طول البعد الأول ثابتًا ويسمح لك بالرجوع إلى قيمة العناصر الكامنة المقابلة لتلك الصورة.
لقد اخترنا قيم الكامنة عن عمد لإجراء تغييرات أصغر في الخطوات مع ضمان اختلاف جميع مخرجات البكسل. لم يتم إضافة ضجيج.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/deepmind/dsprites-dataset
كود المصدر :
tfds.datasets.dsprites.Builder
إصدارات :
-
2.0.0
(افتراضي): تقسيم API جديد ( https://tensorflow.org/datasets/splits ) -
2.1.0
: لا توجد ملاحظات الإصدار.
-
حجم التحميل :
26.73 MiB
حجم مجموعة البيانات :
Unknown size
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 737280 |
- هيكل الميزة :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صورة | صورة | (64 ، 64 ، 1) | uint8 | |
التسمية_التوجيه | ClassLabel | int64 | ||
مقياس_المسمية | ClassLabel | int64 | ||
التسمية_شكل | ClassLabel | int64 | ||
label_x_position | ClassLabel | int64 | ||
التسمية_y_position | ClassLabel | int64 | ||
التوجه قيمة | موتر | تعويم 32 | ||
مقياس القيمة | موتر | تعويم 32 | ||
شكل_قيمة | موتر | تعويم 32 | ||
القيمة_x_position | موتر | تعويم 32 | ||
القيمة_ص_الوضعية | موتر | تعويم 32 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}