- توضیحات :
این مجموعه داده از 6642 جفت پرسش/پاسخ تشکیل شده است. فرض بر این است که سؤالات توسط Freebase، یک نمودار دانش بزرگ، پاسخ داده شوند. سوالات بیشتر حول یک نهاد با نام متمرکز هستند. سؤالات رایجی هستند که در وب پرسیده می شوند (حداقل در سال 2013).
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a
کد منبع :
tfds.question_answering.WebQuestions
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.21 MiB
اندازه مجموعه داده :
983.88 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2032 |
'train' | 3778 |
- ساختار ویژگی :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'question': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
پاسخ می دهد | دنباله (متن) | (هیچ یک،) | رشته | |
سوال | متن | رشته | ||
آدرس اینترنتی | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{berant-etal-2013-semantic,
title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
author = "Berant, Jonathan and
Chou, Andrew and
Frostig, Roy and
Liang, Percy",
booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
month = oct,
year = "2013",
address = "Seattle, Washington, USA",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D13-1160",
pages = "1533--1544",
}