- Mô tả:
SAVEE (Surrey Audio-Visual Expression Emotion) là tập dữ liệu nhận dạng cảm xúc. Nó bao gồm các đoạn ghi âm của 4 diễn viên nam với 7 cung bậc cảm xúc khác nhau, tổng cộng là 480 câu nói tiếng Anh của người Anh. Các câu được chọn từ kho ngữ liệu TIMIT tiêu chuẩn và được cân bằng ngữ âm cho từng cảm xúc. Bản phát hành này chỉ chứa luồng âm thanh từ bản ghi âm thanh-hình ảnh gốc. Dữ liệu được phân tách để tập hợp đào tạo bao gồm 2 người nói và cả tập hợp kiểm tra và xác nhận đều bao gồm các mẫu từ 1 người nói tương ứng.
Trang chủ: http://kahlan.eps.surrey.ac.uk/savee/
Source code:
tfds.audio.Savee
phiên bản:
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Dung lượng tải về:
Unknown size
Dataset kích thước:
259.15 MiB
Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào
download_config.manual_dir
(mặc định là~/tensorflow_datasets/downloads/manual/
):
manual_dir phải chứa tệp AudioData.zip. Tệp này phải nằm trong Data / Zip / AudioData.zip trong thư mục tập dữ liệu được cung cấp khi đăng ký. Bạn cần phải đăng ký tại http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html để có được các liên kết để tải dữ liệu.Tự động lưu trữ ( tài liệu ): Không
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 120 |
'train' | 240 |
'validation' | 120 |
- Các tính năng:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'speaker_id': tf.string,
})
Phím giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}