ויקי_דיאלוג

  • תיאור :

WikiDialog הוא מערך נתונים גדול של שיחות חיפוש מידע שנוצרו באופן סינתטי. כל שיחה במערך הנתונים מכילה שני דוברים המעוגנים בקטע מויקיפדיה האנגלית: התבטאויותיו של דובר אחד מורכבות ממשפטים מדויקים מהקטע; הדובר השני נוצר על ידי מודל שפה גדול.

לְפַצֵל דוגמאות
'train' 11,264,129
'validation' 113,822
  • מבנה תכונה :
FeaturesDict({
   
'author_num': Sequence(int32),
   
'passage': Text(shape=(), dtype=string),
   
'pid': Text(shape=(), dtype=string),
   
'sentences': Sequence(Text(shape=(), dtype=string)),
   
'title': Text(shape=(), dtype=string),
   
'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
מחבר_מספר רצף (טנזור) (אף אחד,) int32
מַעֲבָר טֶקסט חוּט
pid טֶקסט חוּט
משפטים רצף (טקסט) (אף אחד,) חוּט
כותרת טֶקסט חוּט
התבטאויות רצף (טקסט) (אף אחד,) חוּט
  • ציטוט :
@inproceedings{dai2022dialoginpainting,
  title
={Dialog Inpainting: Turning Documents to Dialogs},
  author
={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle
={International Conference on Machine Learning (ICML)},
  year
={2022},
  organization
={PMLR}
}

wiki_dialog/OQ (תצורת ברירת המחדל)