- توضیحات :
WikiDialog یک مجموعه داده بزرگ از مکالمات جستجوی اطلاعات مصنوعی است. هر مکالمه در مجموعه داده شامل دو سخنران است که در یک قطعه از ویکیپدیای انگلیسی پایه گذاری شدهاند: گفتههای یک گوینده شامل جملات دقیق آن متن است. سخنران دیگر توسط یک مدل زبان بزرگ تولید می شود.
شرح پیکربندی : WikiDialog از دیالوگ inpainter ایجاد شده است که روی OR-QuAC و QReCC تنظیم شده است.
OQ
مخفف OR-QuAC و QReCC است.صفحه اصلی : https://github.com/google-research/dialog-inpainting#wikidialog-oq
کد منبع :
tfds.text.wiki_dialog.WikiDialog
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
7.04 GiB
حجم مجموعه داده :
36.58 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 11,264,129 |
'validation' | 113,822 |
- ساختار ویژگی :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
نویسنده_تعداد | دنباله (تنسور) | (هیچ یک،) | int32 | |
گذر | متن | رشته | ||
pid | متن | رشته | ||
جمله ها | دنباله (متن) | (هیچ یک،) | رشته | |
عنوان | متن | رشته | ||
گفته ها | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}