xsum

  • Descripción :

Conjunto de datos de resumen extremo (XSum).

Hay dos características: - documento: artículo de entrada de noticias. - resumen: Resumen de una oración del artículo.

Estos datos deben descargarse y extraerse manualmente como se describe en https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md La carpeta 'xsum-extracts-from-downloads' debe comprimirse como 'xsum-extracts-from-downloads.tar.gz' y colóquelo en la carpeta descargada manualmente.

Separar Ejemplos
'test' 11,301
'train' 203,577
'validation' 11,305
  • Estructura de características :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
documento Texto cuerda
resumen Texto cuerda
  • Cita :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}