voxforge

  • Descripción :

VoxForge es un conjunto de datos de clasificación de idiomas. Consiste en clips de audio enviados por el usuario enviados al sitio web. En esta versión, se recopilan datos de 6 idiomas: inglés, español, francés, alemán, ruso e italiano. Dado que el sitio web se actualiza constantemente, y en aras de la reproducibilidad, este comunicado contiene solo grabaciones enviadas antes del 2020-01-01. Las muestras se dividen entre entrenamiento, validación y prueba para que las muestras de cada hablante pertenezcan exactamente a una división.

  • Documentación adicional : Explore en Papers With Code

  • Página de inicio : http://www.voxforge.org/

  • Código fuente : tfds.audio.Voxforge

  • Versiones :

    • 1.0.0 (predeterminado): Sin notas de la versión.
  • Tamaño de descarga : Unknown size

  • Tamaño del conjunto de datos : Unknown size

  • Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge requiere la descarga manual de los archivos de audio. La lista completa de archivos se puede encontrar en https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Se puede descargar usando el siguiente comando: wget -i voxforge_urls.txt -x Tenga en cuenta que la descarga y construir el conjunto de datos localmente requiere ~ 100 GB de espacio en disco (pero solo se usarán ~ 60 GB de forma permanente).

  • Auto-caché ( documentación ): Desconocido

  • Divisiones :

Separar Ejemplos
  • Estructura de características :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
audio Audio (Ninguna,) int64
etiqueta Etiqueta de clase int64
altavoz_id Tensor cuerda
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}