- الوصف:
CREMA-D عبارة عن مجموعة بيانات صوتية ومرئية للتعرف على المشاعر. تتكون مجموعة البيانات من تعبيرات عاطفية وجهية وصوتية في جمل منطوقة في مجموعة من الحالات العاطفية الأساسية (سعيد ، حزين ، غضب ، خوف ، اشمئزاز ، وحيادية). تم جمع 7442 مقطعًا من 91 ممثلًا من خلفيات عرقية متنوعة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.
الصفحة الرئيسية: https://github.com/CheyneyComputerScience/CREMA-D
شفرة المصدر:
tfds.audio.CremaD
إصدارات:
-
1.0.0
(الافتراضي): لا ملاحظات الإصدار.
-
حجم التحميل:
579.25 MiB
حجم بيانات:
1.65 GiB
المخزنة السيارات ( وثائق ): لا
الإنشقاقات:
انشق، مزق | أمثلة |
---|---|
'test' | 1،556 |
'train' | 5،144 |
'validation' | 738 |
- الميزات:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
مفاتيح تحت الملاحظة (انظر
as_supervised
ثيقة ):('audio', 'label')
الشكل ( tfds.show_examples ): غير معتمد.
أمثلة ( tfds.as_dataframe ):
- الاقتباس:
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}