krem_d

  • Deskripsi :

CREMA-D adalah kumpulan data audio-visual untuk pengenalan emosi. Kumpulan data terdiri dari ekspresi emosional wajah dan vokal dalam kalimat yang diucapkan dalam berbagai keadaan emosi dasar (senang, sedih, marah, takut, jijik, dan netral). 7.442 klip dari 91 aktor dengan latar belakang etnis yang beragam dikumpulkan. Rilis ini hanya berisi streaming audio dari rekaman audio-visual asli. Sampel dibagi antara pelatihan, validasi, dan pengujian sehingga sampel dari masing-masing pembicara termasuk dalam satu pemisahan.

Membelah Contoh
'test' 1.556
'train' 5.144
'validation' 738
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int64
label LabelKelas int64
speaker_id Tensor rangkaian
  • Kutipan :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}