voxforge

  • Deskripsi :

VoxForge adalah kumpulan data klasifikasi bahasa. Ini terdiri dari klip audio yang dikirimkan pengguna yang dikirimkan ke situs web. Rilis ini mengumpulkan data dari 6 bahasa - Inggris, Spanyol, Prancis, Jerman, Rusia, dan Italia. Karena situs web terus diperbarui, dan demi reproduktifitas, rilis ini hanya berisi rekaman yang dikirimkan sebelum 01-01-2020. Sampel dibagi antara pelatihan, validasi, dan pengujian sehingga sampel dari masing-masing pembicara termasuk dalam satu pemisahan.

  • Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode

  • Beranda : http://www.voxforge.org/

  • Kode sumber : tfds.audio.Voxforge

  • Versi :

    • 1.0.0 (default): Tidak ada catatan rilis.
  • Ukuran unduhan : Unknown size

  • Ukuran set data : Unknown size

  • Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default ke ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge memerlukan pengunduhan arsip audio secara manual. Daftar lengkap arsip dapat ditemukan di https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Dapat diunduh menggunakan perintah berikut: wget -i voxforge_urls.txt -x Perhatikan bahwa mengunduh dan membangun kumpulan data secara lokal membutuhkan ~100GB ruang disk (namun hanya ~60GB yang akan digunakan secara permanen).

  • Di-cache otomatis ( dokumentasi ): Tidak diketahui

  • Perpecahan :

Membelah Contoh
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int64
label LabelKelas int64
speaker_id Tensor rangkaian
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}