voxforge

  • Mô tả:

VoxForge là một tập dữ liệu phân loại ngôn ngữ. Nó bao gồm các đoạn âm thanh do người dùng gửi lên trang web. Trong bản phát hành này, dữ liệu từ 6 ngôn ngữ được thu thập - tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Nga và tiếng Ý. Vì trang web được cập nhật liên tục và vì mục đích tái tạo, bản phát hành này chỉ chứa các bản ghi âm được gửi trước 2020-01-01. Các mẫu được phân chia giữa quá trình đào tạo, xác nhận và thử nghiệm để các mẫu từ mỗi loa thuộc về chính xác một lần phân chia.

  • Trang chủ: http://www.voxforge.org/

  • Source code: tfds.audio.Voxforge

  • phiên bản:

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Dung lượng tải về: Unknown size

  • Kích thước tập dữ liệu: Unknown size

  • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge yêu cầu tải xuống thủ công các kho lưu trữ âm thanh. Danh sách đầy đủ của tài liệu lưu trữ có thể được tìm thấy trong https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Nó có thể được tải về bằng cách sử dụng lệnh sau: wget -i voxforge_urls.txt -x Lưu ý rằng tải và việc xây dựng tập dữ liệu cục bộ yêu cầu ~ 100GB dung lượng đĩa (nhưng chỉ ~ 60GB sẽ được sử dụng vĩnh viễn).

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
  • Các tính năng:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}