- توضیحات :
مجموعه داده شامل 5957 سوال چهار گزینه ای است. علاوه بر این، آنها 5167 حقایق دانش مشترک با منبع جمعی و یک نسخه گسترده از سؤالات قطار/dev/آزمون را ارائه میکنند که در آن هر سؤال با واقعیت اصلی خود، امتیاز دقت انسانی، نمره وضوح، و یک کارگر جمعی ناشناس مرتبط است. شناسه.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
کد منبع :
tfds.datasets.openbookqa.Builder
نسخه ها :
-
0.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.38 MiB
حجم مجموعه داده :
2.40 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 500 |
'train' | 4,957 |
'validation' | 500 |
- ساختار ویژگی :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
کلید پاسخ | ClassLabel | int64 | ||
وضوح | تانسور | float32 | ||
واقعیت 1 | متن | رشته | ||
امتیاز انسانی | تانسور | float32 | ||
سوال | FeaturesDict | |||
سوال/انتخاب_الف | متن | رشته | ||
سوال/انتخاب_ب | متن | رشته | ||
سوال/انتخاب_C | متن | رشته | ||
سوال/انتخاب_د | متن | رشته | ||
سوال/ساقه | متن | رشته | ||
turkIdAnonymized | متن | رشته |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('question', 'answerKey')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}