krem_d

  • Keterangan:

CREMA-D adalah kumpulan data audio-visual untuk pengenalan emosi. Kumpulan data terdiri dari ekspresi emosional wajah dan vokal dalam kalimat yang diucapkan dalam berbagai keadaan emosi dasar (senang, sedih, marah, takut, jijik, dan netral). 7.442 klip dari 91 aktor dengan latar belakang etnis yang beragam dikumpulkan. Rilis ini hanya berisi aliran audio dari rekaman audio visual asli. Sampel dibagi antara pelatihan, validasi, dan pengujian sehingga sampel dari setiap pembicara memiliki tepat satu pemisahan.

Membelah Contoh
'test' 1,556
'train' 5,144
'validation' 738
  • fitur:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • Citation:
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}