sim não

Descrição :

Sessenta gravações de um indivíduo dizendo sim ou não em hebraico; cada gravação tem oito palavras.

O ponto principal do conjunto de dados é fornecer uma maneira fácil e rápida de testar os scripts Kaldi gratuitamente.

O arquivo "waves_yesno.tar.gz" contém 60 arquivos .wav, amostrados em 8 kHz. Todas foram gravadas pelo mesmo falante masculino, em hebraico. Em cada arquivo, o indivíduo diz 8 palavras; cada palavra é o hebraico para "sim" ou "não", então cada arquivo é uma sequência aleatória de 8 sim ou não. Não há transcrição separada fornecida; a sequência é codificada no nome do arquivo, com 1 para sim e 0 para não.

Documentação Adicional : Explore em Papers With Code
Página inicial : https://www.openslr.org/1/
Código -fonte: tfds.audio.yesno.YesNo
Versões :
- 1.0.0 (padrão): sem notas de versão.
Tamanho do download : 4.49 MiB
Tamanho do conjunto de dados : 16.27 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	60

Estrutura de recursos :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D
	RecursosDict
áudio	áudio	(Nenhum,)	int64
áudio/nome do arquivo	Texto		corda
etiqueta	Sequência(ClassLabel)	(Nenhum,)	int64

Chaves supervisionadas (consulte o documento as_supervised ): ('audio', 'label')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):

Citação :

@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}

sim não Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

sim não