- Deskripsi :
Ini adalah kumpulan data ucapan domain publik yang terdiri dari 13.100 klip audio pendek dari satu bagian bacaan pembicara dari 7 buku non-fiksi. Transkripsi disediakan untuk setiap klip. Panjang klip bervariasi dari 1 hingga 10 detik dan memiliki durasi total sekitar 24 jam.
Teks-teks tersebut diterbitkan antara tahun 1884 dan 1964, dan berada dalam domain publik. Audio direkam pada 2016-17 oleh proyek LibriVox dan juga berada dalam domain publik.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://keithito.com/LJ-Speech-Dataset/
Kode sumber :
tfds.datasets.ljspeech.Builder
Versi :
-
1.1.1
(default): Perbaiki tipe data ucapan dengan dtype=tf.int16.
-
Ukuran unduhan :
2.56 GiB
Ukuran dataset :
10.73 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 13.100 |
- Struktur fitur :
FeaturesDict({
'id': string,
'speech': Audio(shape=(None,), dtype=int16),
'text': Text(shape=(), dtype=string),
'text_normalized': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Indo | Tensor | rangkaian | ||
pidato | Audio | (Tidak ada,) | int16 | |
teks | Teks | rangkaian | ||
text_normalized | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('text_normalized', 'speech')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}