- Deskripsi :
Enam puluh rekaman dari satu orang mengatakan ya atau tidak dalam bahasa Ibrani; setiap rekaman panjangnya delapan kata.
Poin utama dari kumpulan data ini adalah untuk menyediakan cara yang mudah dan cepat untuk menguji skrip Kaldi secara gratis.
Arsip "waves_yesno.tar.gz" berisi 60 file .wav, diambil sampelnya pada 8 kHz. Semuanya direkam oleh penutur laki-laki yang sama, dalam bahasa Ibrani. Di setiap file, individu mengucapkan 8 kata; setiap kata adalah bahasa Ibrani untuk "ya" atau "tidak", jadi setiap file adalah urutan acak dari 8 ya atau tidak. Tidak ada transkripsi terpisah yang disediakan; urutannya dikodekan dalam nama file, dengan 1 untuk ya dan 0 untuk tidak.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://www.openslr.org/1/
Kode sumber :
tfds.audio.yesno.YesNo
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
4.49 MiB
Ukuran dataset :
16.27 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 60 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
audio | Audio | (Tidak ada,) | int64 | |
audio/nama file | Teks | rangkaian | ||
label | Urutan(Label Kelas) | (Tidak ada,) | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}