giọng điệu

  • Mô tả :

AccentDB là một kho ngữ liệu song song nhiều cặp gồm lời nói có trọng âm có cấu trúc và được gắn nhãn. Nó chứa các mẫu bài phát biểu của những người nói 4 giọng không phải giọng mẹ đẻ của tiếng Anh (8 người nói, 4 ngôn ngữ Ấn Độ); và cũng có tổng hợp 4 giọng bản ngữ của tiếng Anh (4 quốc gia, 13 người nói) và giọng Ấn Độ đô thị (2 người nói). Tập dữ liệu có sẵn ở đây tương ứng với bản phát hành có tiêu đề voicedb_extended trên https://accentdb.github.io/#dataset

  • Trang chủ : https://accentdb.github.io/

  • Mã nguồn : tfds.audio.Accentdb

  • Các phiên bản :

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : 3.56 GiB

  • Kích thước tập dữ liệu : 19.47 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 17.313
  • Các tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=9),
    'speaker_id': tf.string,
})
  • Trích dẫn :
@InProceedings{ahamad-anand-bhargava:2020:LREC,
  author    = {Ahamad, Afroz  and  Anand, Ankit  and  Bhargava, Pranesh},
  title     = {AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition},
  booktitle      = {Proceedings of The 12th Language Resources and Evaluation Conference},
  month          = {May},
  year           = {2020},
  address        = {Marseille, France},
  publisher      = {European Language Resources Association},
  pages     = {5353--5360},
  url       = {https://www.aclweb.org/anthology/2020.lrec-1.659}
}