- Mô tả:
Multi-News, bao gồm các tin bài và bản tóm tắt do con người viết về những bài báo này từ trang newser.com. Mỗi bản tóm tắt được viết bởi các biên tập viên một cách chuyên nghiệp và bao gồm các liên kết đến các bài báo gốc được trích dẫn.
Có hai tính năng: - tài liệu: văn bản của các bài báo được phân tách bằng mã thông báo đặc biệt "|||||". - tóm tắt: tóm tắt tin tức.
Trang chủ: https://github.com/Alex-Fabbri/Multi-News
Source code:
tfds.summarization.MultiNews
phiên bản:
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Dung lượng tải về:
245.06 MiB
Kích thước tập dữ liệu:
Unknown size
Tự động lưu trữ ( tài liệu ): Unknown
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 5.622 |
'train' | 44,972 |
'validation' | 5.622 |
- Các tính năng:
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
Phím giám sát (Xem
as_supervised
doc ):('document', 'summary')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}