ya Tidak

  • Deskripsi :

Enam puluh rekaman dari satu orang mengatakan ya atau tidak dalam bahasa Ibrani; setiap rekaman panjangnya delapan kata.

Poin utama dari kumpulan data ini adalah untuk menyediakan cara yang mudah dan cepat untuk menguji skrip Kaldi secara gratis.

Arsip "waves_yesno.tar.gz" berisi 60 file .wav, diambil sampelnya pada 8 kHz. Semuanya direkam oleh penutur laki-laki yang sama, dalam bahasa Ibrani. Di setiap file, individu mengucapkan 8 kata; setiap kata adalah bahasa Ibrani untuk "ya" atau "tidak", jadi setiap file adalah urutan acak dari 8 ya atau tidak. Tidak ada transkripsi terpisah yang disediakan; urutannya dikodekan dalam nama file, dengan 1 untuk ya dan 0 untuk tidak.

Membelah Contoh
'train' 60
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int64
audio/nama file Teks rangkaian
label Urutan(Label Kelas) (Tidak ada,) int64
  • Kutipan :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}