- Descrição :
Sessenta gravações de um indivíduo dizendo sim ou não em hebraico; cada gravação tem oito palavras.
O ponto principal do conjunto de dados é fornecer uma maneira fácil e rápida de testar os scripts Kaldi gratuitamente.
O arquivo "waves_yesno.tar.gz" contém 60 arquivos .wav, amostrados em 8 kHz. Todas foram gravadas pelo mesmo falante masculino, em hebraico. Em cada arquivo, o indivíduo diz 8 palavras; cada palavra é o hebraico para "sim" ou "não", então cada arquivo é uma sequência aleatória de 8 sim ou não. Não há transcrição separada fornecida; a sequência é codificada no nome do arquivo, com 1 para sim e 0 para não.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://www.openslr.org/1/
Código -fonte:
tfds.audio.yesno.YesNo
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
4.49 MiB
Tamanho do conjunto de dados :
16.27 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'train' | 60 |
- Estrutura de recursos :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
áudio | áudio | (Nenhum,) | int64 | |
áudio/nome do arquivo | Texto | corda | ||
etiqueta | Sequência(ClassLabel) | (Nenhum,) | int64 |
Chaves supervisionadas (consulte o documento
as_supervised
):('audio', 'label')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}