- Descrição :
AccentDB é um corpus paralelo de vários pares de fala com sotaque estruturado e rotulado. Ele contém amostras de fala de falantes de 4 sotaques não nativos do inglês (8 falantes, 4 idiomas indianos); e também tem uma compilação de 4 sotaques nativos de inglês (4 países, 13 falantes) e um sotaque indiano metropolitano (2 falantes). O conjunto de dados disponível aqui corresponde ao lançamento intituladocentdb_extended em https://accentdb.github.io/#dataset
Documentação Adicional : Explore em Papers With Code
Página inicial : https://accentdb.github.io/
Código -fonte:
tfds.datasets.accentdb.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
3.56 GiB
Tamanho do conjunto de dados :
19.47 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 17.313 |
- Estrutura de recursos :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=9),
'speaker_id': string,
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
áudio | áudio | (Nenhum,) | int64 | |
etiqueta | ClassLabel | int64 | ||
speaker_id | tensor | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('audio', 'label')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@InProceedings{ahamad-anand-bhargava:2020:LREC,
author = {Ahamad, Afroz and Anand, Ankit and Bhargava, Pranesh},
title = {AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition},
booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference},
month = {May},
year = {2020},
address = {Marseille, France},
publisher = {European Language Resources Association},
pages = {5353--5360},
url = {https://www.aclweb.org/anthology/2020.lrec-1.659}
}