voxforge

  • Açıklama :

VoxForge bir dil sınıflandırma veri kümesidir. Web sitesine gönderilen, kullanıcı tarafından gönderilen ses kliplerinden oluşur. Bu sürümde 6 dilden veri toplanmıştır - İngilizce, İspanyolca, Fransızca, Almanca, Rusça ve İtalyanca. Web sitesi sürekli olarak güncellendiğinden ve tekrarlanabilirlik adına bu sürüm yalnızca 2020-01-01 tarihinden önce gönderilen kayıtları içermektedir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir ayrıma ait olması için tren, doğrulama ve test arasında bölünmüştür.

  • Ek Belgeler : Belgeleri Keşfedin

  • Ana sayfa : http://www.voxforge.org/

  • Kaynak kodu : tfds.audio.Voxforge

  • sürümler :

    • 1.0.0 (varsayılan): Sürüm notu yok.
  • İndirme boyutu : Unknown size

  • Veri kümesi boyutu : Unknown size

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine download_config.manual_dir gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge, ses arşivlerinin manuel olarak indirilmesini gerektirir. Arşivlerin tam listesi https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt adresinde bulunabilir. Aşağıdaki komut kullanılarak indirilebilir: wget -i voxforge_urls.txt -x İndirirken dikkat edin ve veri kümesini yerel olarak oluşturmak ~100GB disk alanı gerektirir (ancak kalıcı olarak yalnızca ~60GB kullanılacaktır).

  • Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor

  • bölmeler :

Bölmek örnekler
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
ses Ses (Hiçbiri,) int64
etiket SınıfEtiketi int64
hoparlör_kimliği tensör sicim
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}