- 説明:
LibriSpeech ASR コーパスと組み合わせて使用される言語モデリング リソース。
ホームページ: http://www.openslr.org/11
ソース コード:
tfds.datasets.librispeech_lm.Builderバージョン:
-
0.1.0(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
1.40 GiBデータセットサイズ:
4.62 GiB自動キャッシュ(ドキュメント): いいえ
スプリット:
| スプリット | 例 |
|---|---|
'train' | 40,418,260 |
- 機能構造:
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| 文章 | 文章 | ストリング |
監視されたキー(
as_superviseddocを参照):('text', 'text')図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}