- विवरण :
LibriTTS 24kHz नमूनाकरण दर पर लगभग 585 घंटे पढ़ी जाने वाली अंग्रेजी भाषण का एक बहु-स्पीकर अंग्रेजी कॉर्पस है, जिसे Heiga Zen द्वारा Google भाषण और Google ब्रेन टीम के सदस्यों की सहायता से तैयार किया गया है। LibriTTS कॉर्पस को TTS अनुसंधान के लिए डिज़ाइन किया गया है। यह लिब्रीस्पीच कॉर्पस की मूल सामग्री (लिब्रीवॉक्स से एमपी3 ऑडियो फाइल और प्रोजेक्ट गुटेनबर्ग से टेक्स्ट फाइल) से ली गई है। लिब्रीस्पीच कॉर्पस से मुख्य अंतर नीचे सूचीबद्ध हैं:
- ऑडियो फ़ाइलें 24kHz नमूनाकरण दर पर हैं।
- भाषण वाक्य विराम पर विभाजित है।
- मूल और सामान्यीकृत दोनों ग्रंथ शामिल हैं।
- प्रासंगिक जानकारी (जैसे, पड़ोसी वाक्य) निकाली जा सकती है।
- महत्वपूर्ण पृष्ठभूमि शोर वाले कथनों को बाहर रखा गया है।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : http://www.openslr.org/60
स्रोत कोड :
tfds.datasets.libritts.Builderसंस्करण :
-
1.0.1(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
78.42 GiBडेटासेट का आकार :
271.41 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'dev_clean' | 5,736 |
'dev_other' | 4,613 |
'test_clean' | 4,837 |
'test_other' | 5,120 |
'train_clean100' | 33,236 |
'train_clean360' | 116,500 |
'train_other500' | 205,044 |
- फ़ीचर संरचना :
FeaturesDict({
'chapter_id': int64,
'id': string,
'speaker_id': int64,
'speech': Audio(shape=(None,), dtype=int64),
'text_normalized': Text(shape=(), dtype=string),
'text_original': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| अध्याय_आईडी | टेन्सर | int64 | ||
| पहचान | टेन्सर | डोरी | ||
| स्पीकर_आईडी | टेन्सर | int64 | ||
| भाषण | ऑडियो | (कोई भी नहीं,) | int64 | |
| text_सामान्यीकृत | मूलपाठ | डोरी | ||
| text_original | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('text_normalized', 'speech')चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}