voxforge

 • opis :

VoxForge to zestaw danych do klasyfikacji języków. Składa się z przesłanych przez użytkowników klipów audio przesłanych na stronę internetową. W tej wersji gromadzone są dane z 6 języków — angielskiego, hiszpańskiego, francuskiego, niemieckiego, rosyjskiego i włoskiego. Ponieważ witryna jest stale aktualizowana i ze względu na powtarzalność, niniejsze wydanie zawiera tylko nagrania przesłane przed 2020-01-01. Próbki są dzielone między pociąg, walidację i testowanie, tak aby próbki z każdego mówcy należały dokładnie do jednego podziału.

 • Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na

 • Strona główna : http://www.voxforge.org/

 • Kod źródłowy : tfds.audio.Voxforge

 • Wersje :

  • 1.0.0 (domyślnie): Brak informacji o wersji.
 • Rozmiar pliku do pobrania : Unknown size

 • Rozmiar zbioru danych : Unknown size

 • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
  VoxForge wymaga ręcznego pobrania archiwów audio. Pełną listę archiwów można znaleźć pod adresem https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Można je pobrać za pomocą następującego polecenia: wget -i voxforge_urls.txt -x Należy pamiętać, że pobieranie a budowanie zbioru danych lokalnie wymaga około 100 GB miejsca na dysku (ale tylko około 60 GB będzie używane na stałe).

 • Automatyczne buforowanie ( dokumentacja ): Nieznane

 • Podziały :

Rozdzielać Przykłady
 • Struktura funkcji :
FeaturesDict({
  'audio': Audio(shape=(None,), dtype=int64),
  'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
  'speaker_id': string,
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
audio Audio (Nic,) int64
etykieta Etykieta klasy int64
identyfikator_mówcy Napinacz strunowy
@article{maclean2018voxforge,
 title={Voxforge},
 author={MacLean, Ken},
 journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
 year={2018}
}