- 説明:
BillSum、米国議会およびカリフォルニア州法案の要約。
いくつかの機能があります: - テキスト: 請求書のテキスト。 - 概要: 請求書の概要。 - title: 請求書のタイトル。私たちの手形のための機能。 ca bills にはありません。 - text_len: テキストの文字数。 - sum_len: 要約の文字数。
追加のドキュメント:コードを使用したペーパーの探索
ソースコード:
tfds.datasets.billsum.Builderバージョン:
-
3.0.0(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
64.14 MiBデータセットサイズ:
260.84 MiB自動キャッシュ(ドキュメント): いいえ
スプリット:
| スプリット | 例 |
|---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- 機能構造:
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| まとめ | 文章 | ストリング | ||
| 文章 | 文章 | ストリング | ||
| 題名 | 文章 | ストリング |
監視されたキー(
as_superviseddocを参照):('text', 'summary')図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}