multi_berita

  • Deskripsi :

Multi-News, terdiri dari artikel berita dan ringkasan tulisan manusia dari artikel-artikel tersebut dari situs newser.com. Setiap ringkasan ditulis secara profesional oleh editor dan menyertakan tautan ke artikel asli yang dikutip.

Ada dua fitur: - dokumen: teks artikel berita yang dipisahkan oleh token khusus "|||||". - ringkasan: ringkasan berita.

Membelah Contoh
'test' 5.622
'train' 44.972
'validation' 5.622
  • Struktur fitur :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
dokumen Teks rangkaian
ringkasan Teks rangkaian
  • Kutipan :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}