- توضیحات :
مجموعه داده شامل جفت جدول-سوال و پاسخ مربوطه است. سوالات نیاز به استدلال چند مرحله ای و عملیات داده های مختلف مانند مقایسه، تجمیع و محاسبات حسابی دارند. جداول به صورت تصادفی از بین جداول ویکی پدیا با حداقل 8 سطر و 5 ستون انتخاب شدند.
(طبق یادداشت های استفاده از اسناد)
Dev: میانگین دقت بیش از سه (نه پنج) تقسیم داده های آموزشی. به عبارت دیگر، به ترتیب روی 'split-{1,2,3}-train' و روی 'split-{1,2,3}-dev' تمرین کنید، سپس دقت را میانگین کنید.
تست: آموزش روی "قطار" و تست در "تست".
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
کد منبع :
tfds.structured.wiki_table_questions.WikiTableQuestions
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
65.36 MiB
حجم مجموعه داده :
237.24 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'split-1-dev' | 2810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2,838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2,838 |
'split-3-train' | 11,311 |
'test' | 4,344 |
'train' | 14,149 |
- ساختار ویژگی :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
متن ورودی | FeaturesDict | |||
input_text/context | تانسور | رشته | ||
input_text/table | توالی | |||
input_text/table/column_header | تانسور | رشته | ||
input_text/table/content | تانسور | رشته | ||
input_text/table/row_number | تانسور | int16 | ||
هدف_متن | تانسور | رشته |
کلیدهای نظارت شده (مشاهده به
as_supervised
):('input_text', 'target_text')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}