- Deskripsi :
Sumber daya pemodelan bahasa untuk digunakan bersama dengan korpus LibriSpeech ASR.
Beranda : http://www.openslr.org/11
Kode sumber :
tfds.datasets.librispeech_lm.Builder
Versi :
-
0.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
1.40 GiB
Ukuran dataset :
4.62 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 40.418.260 |
- Struktur fitur :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
teks | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('text', 'text')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}