multi_news

 • Mô tả:

Multi-News, bao gồm các tin bài và bản tóm tắt do con người viết về những bài báo này từ trang newser.com. Mỗi bản tóm tắt được viết bởi các biên tập viên một cách chuyên nghiệp và bao gồm các liên kết đến các bài báo gốc được trích dẫn.

Có hai tính năng: - tài liệu: văn bản của các bài báo được phân tách bằng mã thông báo đặc biệt "|||||". - tóm tắt: tóm tắt tin tức.

Tách ra Các ví dụ
'test' 5.622
'train' 44,972
'validation' 5.622
 • Các tính năng:
FeaturesDict({
  'document': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
})
 • Trích dẫn:
@misc{alex2019multinews,
  title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
  author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
  year={2019},
  eprint={1906.01749},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}