tiết kiệm

  • Mô tả:

SAVEE (Surrey Audio-Visual Expression Emotion) là tập dữ liệu nhận dạng cảm xúc. Nó bao gồm các đoạn ghi âm của 4 diễn viên nam với 7 cung bậc cảm xúc khác nhau, tổng cộng là 480 câu nói tiếng Anh của người Anh. Các câu được chọn từ kho ngữ liệu TIMIT tiêu chuẩn và được cân bằng ngữ âm cho từng cảm xúc. Bản phát hành này chỉ chứa luồng âm thanh từ bản ghi âm thanh-hình ảnh gốc. Dữ liệu được phân tách để tập hợp đào tạo bao gồm 2 người nói và cả tập hợp kiểm tra và xác nhận đều bao gồm các mẫu từ 1 người nói tương ứng.

  • Trang chủ: http://kahlan.eps.surrey.ac.uk/savee/

  • Source code: tfds.audio.Savee

  • phiên bản:

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Dung lượng tải về: Unknown size

  • Dataset kích thước: 259.15 MiB

  • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir phải chứa tệp AudioData.zip. Tệp này phải nằm trong Data / Zip / AudioData.zip trong thư mục tập dữ liệu được cung cấp khi đăng ký. Bạn cần phải đăng ký tại http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html để có được các liên kết để tải dữ liệu.

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'test' 120
'train' 240
'validation' 120
  • Các tính năng:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'speaker_id': tf.string,
})
  • Trích dẫn:
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}