- Mô tả:
Đây là tập dữ liệu giọng nói trên miền công cộng bao gồm 13.100 đoạn âm thanh ngắn của một người nói đọc các đoạn từ 7 cuốn sách phi hư cấu. Một bản ghi âm được cung cấp cho mỗi clip. Các clip có độ dài khác nhau từ 1 đến 10 giây và có tổng thời lượng khoảng 24 giờ.
Các văn bản được xuất bản từ năm 1884 đến năm 1964, và thuộc phạm vi công cộng. Âm thanh được ghi lại vào năm 2016-17 bởi dự án LibriVox và cũng thuộc miền công cộng.
Trang chủ: https://keithito.com/LJ-Speech-Dataset/
Source code:
tfds.audio.Ljspeech
phiên bản:
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Dung lượng tải về:
2.56 GiB
Kích thước tập dữ liệu:
10.73 GiB
Tự động lưu trữ ( tài liệu ): Không
tách:
Tách ra | Các ví dụ |
---|---|
'train' | 13.100 |
- Các tính năng:
FeaturesDict({
'id': tf.string,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
'text_normalized': Text(shape=(), dtype=tf.string),
})
Phím giám sát (Xem
as_supervised
doc ):('text_normalized', 'speech')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}