xsum

  • Mô tả:

Tập dữ liệu tổng hợp cực đoan (XSum).

Có hai tính năng: - document: Đầu vào bài báo. - Summary: Tóm tắt một câu của bài báo.

Cần thông tin này để manaully tải về và giải nén như mô tả trong https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md nhu Các 'tải xsum-chiết xuất-từ-' thư mục để được nén dưới dạng 'xsum-extract-from-Download.tar.gz' và đưa vào thư mục tải xuống theo cách thủ công.

Tách ra Các ví dụ
'test' 11.301
'train' 203.577
'validation' 11.305
  • Các tính năng:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}