- תיאור :
Multi-News, מורכב ממאמרי חדשות וסיכומים בכתב אנושי של מאמרים אלו מהאתר newser.com. כל תקציר נכתב בצורה מקצועית על ידי עורכים וכולל קישורים למאמרים המקוריים שצוטטו.
ישנן שתי תכונות: - מסמך: טקסט של מאמרי חדשות מופרדים באסימון מיוחד "|||||". - סיכום: תקציר חדשות.
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.summarization.MultiNews
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
245.06 MiB
גודל ערכת נתונים:
669.80 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,622 |
'train' | 44,972 |
'validation' | 5,622 |
- מבנה תכונה :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
מסמך | טֶקסט | חוּט | ||
סיכום | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('document', 'summary')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}