- Descrição :
Recursos de modelagem de linguagem a serem usados em conjunto com o corpus LibriSpeech ASR.
Página inicial : http://www.openslr.org/11
Código-fonte :
tfds.datasets.librispeech_lm.Builder
Versões :
-
0.1.0
(padrão): sem notas de versão.
-
Tamanho do download :
1.40 GiB
Tamanho do conjunto de dados :
4.62 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 40.418.260 |
- Estrutura de recursos :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- Documentação do recurso :
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
texto | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('text', 'text')
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}