krem_d

Deskripsi :

CREMA-D adalah kumpulan data audio-visual untuk pengenalan emosi. Kumpulan data terdiri dari ekspresi emosional wajah dan vokal dalam kalimat yang diucapkan dalam berbagai keadaan emosi dasar (senang, sedih, marah, takut, jijik, dan netral). 7.442 klip dari 91 aktor dengan latar belakang etnis yang beragam dikumpulkan. Rilis ini hanya berisi streaming audio dari rekaman audio-visual asli. Sampel dibagi antara pelatihan, validasi, dan pengujian sehingga sampel dari masing-masing pembicara termasuk dalam satu pemisahan.

Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/CheyneyComputerScience/CREMA-D
Kode sumber : tfds.audio.CremaD
Versi :
- 1.0.0 (default): Tidak ada catatan rilis.
Ukuran unduhan : 579.25 MiB
Ukuran dataset : 1.65 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'test'`	1.556
`'train'`	5.144
`'validation'`	738

Struktur fitur :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Dtype
	fiturDict
audio	Audio	(Tidak ada,)	int64
label	LabelKelas		int64
speaker_id	Tensor		rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): ('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):

Kutipan :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}

krem_d Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

krem_d