ucapan_perintah

  • Deskripsi :

Kumpulan data audio dari kata-kata yang diucapkan yang dirancang untuk membantu melatih dan mengevaluasi sistem pencarian kata kunci. Tujuan utamanya adalah menyediakan cara untuk membuat dan menguji model kecil yang mendeteksi saat satu kata diucapkan, dari sekumpulan sepuluh kata target, dengan kesalahan positif sesedikit mungkin dari kebisingan latar belakang atau ucapan yang tidak terkait. Perhatikan bahwa dalam kumpulan pelatihan dan validasi, label "tidak diketahui" jauh lebih umum daripada label kata target atau kebisingan latar belakang. Satu perbedaan dari versi rilis adalah penanganan segmen diam. Sementara dalam set pengujian segmen diam adalah file reguler 1 detik, dalam pelatihan disediakan segmen panjang di bawah folder "background_noise". Di sini kami membagi kebisingan latar belakang ini menjadi klip 1 detik, dan juga menyimpan salah satu file untuk set validasi.

Membelah Contoh
'test' 4.890
'train' 85.511
'validation' 10.102
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int16),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int16
label LabelKelas int64
  • Kutipan :
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}