کرم_د

 • توضیحات:

CREMA-D یک مجموعه داده سمعی و بصری برای تشخیص احساسات است. مجموعه داده ها شامل بیانات احساسی صورت و صوت در جملاتی است که در طیف وسیعی از حالتهای عاطفی اساسی (شاد ، غمگین ، عصبانیت ، ترس ، انزجار و خنثی) بیان می شوند. 7442 کلیپ از 91 بازیگر با پیشینه های قومی مختلف جمع آوری شد. این نسخه فقط شامل جریان صوتی از ضبط صوتی و تصویری اصلی است. نمونه ها بین قطار ، اعتبار سنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً متعلق به یک تقسیم است.

شکاف مثال ها
'test' 1،556
'train' 5،144
'validation' 738
 • ویژگی ها:
FeaturesDict({
  'audio': Audio(shape=(None,), dtype=tf.int64),
  'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
  'speaker_id': tf.string,
})
 • ارجاع:
@article{cao2014crema,
 title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
 author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
 journal={IEEE transactions on affective computing},
 volume={5},
 number={4},
 pages={377--390},
 year={2014},
 publisher={IEEE}
}