xsum

  • 説明:

Extreme Summarization (XSum) データセット。

2 つの機能があります: - ドキュメント: ニュース記事を入力します。 - 要約: 記事の要約を 1 文で。

このデータは、 https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.mdで説明されているように手動でダウンロードして抽出する必要があります。フォルダ「xsum-extracts-from-downloads」は次のように圧縮する必要があります。 「xsum-extracts-from-downloads.tar.gz」を手動でダウンロードしたフォルダーに入れます。

スプリット
'test' 11,301
'train' 203,577
'validation' 11,305
  • 機能構造:
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
資料文章ストリング
まとめ文章ストリング
  • 引用
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}