billum

  • Mô tả :

BillSum, tóm tắt các dự luật của Quốc hội Hoa Kỳ và tiểu bang California.

Có một số tính năng: - văn bản: văn bản hóa đơn. - tóm tắt: tóm tắt các hóa đơn. - title: tiêu đề của hóa đơn. tính năng cho chúng tôi hóa đơn. hóa đơn ca không có. - text_len: số ký tự trong văn bản. - sum_len: số ký tự tóm tắt.

Tách ra ví dụ
'ca_test' 1.237
'test' 3,269
'train' 18.949
  • Cấu trúc tính năng :
FeaturesDict({
    'summary': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
bản tóm tắt Chữ sợi dây
chữ Chữ sợi dây
Tiêu đề Chữ sợi dây
  • trích dẫn :
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}