crema_d

  • الوصف:

CREMA-D عبارة عن مجموعة بيانات صوتية ومرئية للتعرف على المشاعر. تتكون مجموعة البيانات من تعبيرات عاطفية وجهية وصوتية في جمل منطوقة في مجموعة من الحالات العاطفية الأساسية (سعيد ، حزين ، غضب ، خوف ، اشمئزاز ، وحيادية). تم جمع 7442 مقطعًا من 91 ممثلًا من خلفيات عرقية متنوعة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.

انشق، مزق أمثلة
'test' 1،556
'train' 5،144
'validation' 738
  • الميزات:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • الاقتباس:
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}