- Deskripsi :
SAVEE (Surrey Audio-Visual Expressed Emotion) adalah kumpulan data pengenalan emosi. Ini terdiri dari rekaman dari 4 aktor laki-laki dalam 7 emosi yang berbeda, total 480 ucapan bahasa Inggris British. Kalimat dipilih dari corpus TIMIT standar dan seimbang secara fonetik untuk setiap emosi. Rilis ini hanya berisi streaming audio dari rekaman audio-visual asli.
Data dibagi sehingga set pelatihan terdiri dari 2 pembicara, dan set validasi dan tes masing-masing terdiri dari sampel dari 1 pembicara.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://kahlan.eps.surrey.ac.uk/savee/
Kode sumber :
tfds.datasets.savee.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
Unknown size
Ukuran dataset :
259.15 MiB
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default ke~/tensorflow_datasets/downloads/manual/
):
manual_dir harus berisi file AudioData.zip. File ini harus berada di bawah Data/Zip/AudioData.zip di folder kumpulan data yang disediakan saat pendaftaran. Anda harus mendaftar di http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html untuk mendapatkan tautan untuk mengunduh kumpulan data.Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 120 |
'train' | 240 |
'validation' | 120 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
'speaker_id': string,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
audio | Audio | (Tidak ada,) | int64 | |
label | LabelKelas | int64 | ||
speaker_id | Tensor | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}