- Deskripsi :
Kumpulan data audio dari kata-kata yang diucapkan yang dirancang untuk membantu melatih dan mengevaluasi sistem pencarian kata kunci. Tujuan utamanya adalah menyediakan cara untuk membuat dan menguji model kecil yang mendeteksi saat satu kata diucapkan, dari sekumpulan sepuluh kata target, dengan kesalahan positif sesedikit mungkin dari kebisingan latar belakang atau ucapan yang tidak terkait. Perhatikan bahwa dalam kumpulan pelatihan dan validasi, label "tidak diketahui" jauh lebih umum daripada label kata target atau kebisingan latar belakang. Satu perbedaan dari versi rilis adalah penanganan segmen diam. Sementara dalam set pengujian segmen diam adalah file reguler 1 detik, dalam pelatihan disediakan segmen panjang di bawah folder "background_noise". Di sini kami membagi kebisingan latar belakang ini menjadi klip 1 detik, dan juga menyimpan salah satu file untuk set validasi.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://arxiv.org/abs/1804.03209
Kode sumber :
tfds.datasets.speech_commands.Builder
Versi :
-
0.0.3
(default): Perbaiki tipe data audio dengan dtype=tf.int16.
-
Ukuran unduhan :
2.37 GiB
Ukuran dataset :
8.17 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 4.890 |
'train' | 85.511 |
'validation' | 10.102 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int16),
'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
audio | Audio | (Tidak ada,) | int16 | |
label | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{speechcommandsv2,
author = { {Warden}, P.},
title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
journal = {ArXiv e-prints},
archivePrefix = "arXiv",
eprint = {1804.03209},
primaryClass = "cs.CL",
keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
year = 2018,
month = apr,
url = {https://arxiv.org/abs/1804.03209},
}