- תיאור :
WikiDialog הוא מערך נתונים גדול של שיחות חיפוש מידע שנוצרו באופן סינתטי. כל שיחה במערך הנתונים מכילה שני דוברים המעוגנים בקטע מויקיפדיה האנגלית: התבטאויותיו של דובר אחד מורכבות ממשפטים מדויקים מהקטע; הדובר השני נוצר על ידי מודל שפה גדול.
תיאור תצורה : WikiDialog שנוצר מתוך צייר הדו-שיח המכוונן עדין על OR-QuAC ו-QReCC.
OQ
ראשי תיבות של OR-QuAC ו-QReCC.דף הבית : https://github.com/google-research/dialog-inpainting#wikidialog-oq
קוד מקור :
tfds.text.wiki_dialog.WikiDialog
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
7.04 GiB
גודל מערך נתונים :
36.58 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 11,264,129 |
'validation' | 113,822 |
- מבנה תכונה :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
מחבר_מספר | רצף (טנזור) | (אף אחד,) | int32 | |
מַעֲבָר | טֶקסט | חוּט | ||
pid | טֶקסט | חוּט | ||
משפטים | רצף (טקסט) | (אף אחד,) | חוּט | |
כותרת | טֶקסט | חוּט | ||
התבטאויות | רצף (טקסט) | (אף אחד,) | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}