crema_d

  • Beschreibung:

CREMA-D ist ein audiovisueller Datensatz zur Emotionserkennung. Der Datensatz besteht aus emotionalen Gesichts- und Stimmausdrücken in Sätzen, die in einer Reihe von emotionalen Grundzuständen gesprochen werden (glücklich, traurig, Wut, Angst, Ekel und neutral). 7.442 Clips von 91 Schauspielern mit unterschiedlichem ethnischen Hintergrund wurden gesammelt. Diese Pressemitteilung enthält nur den Audiostream der ursprünglichen audiovisuellen Aufnahme. Die Samples werden auf Train, Validation und Testing aufgeteilt, sodass Samples von jedem Lautsprecher zu genau einem Split gehören.

Teilt Beispiele
'test' 1.556
'train' 5.144
'validation' 738
  • Eigenschaften:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • Zitat:
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}