openbookqa

  • توضیحات :

مجموعه داده شامل 5957 سوال چهار گزینه ای است. علاوه بر این، آنها 5167 حقایق دانش مشترک با منبع جمعی و یک نسخه گسترده از سؤالات قطار/dev/آزمون را ارائه می‌کنند که در آن هر سؤال با واقعیت اصلی خود، امتیاز دقت انسانی، نمره وضوح، و یک کارگر جمعی ناشناس مرتبط است. شناسه.

شکاف مثال ها
'test' 500
'train' 4,957
'validation' 500
  • ساختار ویژگی :
FeaturesDict({
   
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'clarity': float32,
   
'fact1': Text(shape=(), dtype=string),
   
'humanScore': float32,
   
'question': FeaturesDict({
       
'choice_A': Text(shape=(), dtype=string),
       
'choice_B': Text(shape=(), dtype=string),
       
'choice_C': Text(shape=(), dtype=string),
       
'choice_D': Text(shape=(), dtype=string),
       
'stem': Text(shape=(), dtype=string),
   
}),
   
'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
کلید پاسخ ClassLabel int64
وضوح تانسور float32
واقعیت 1 متن رشته
امتیاز انسانی تانسور float32
سوال FeaturesDict
سوال/انتخاب_الف متن رشته
سوال/انتخاب_ب متن رشته
سوال/انتخاب_C متن رشته
سوال/انتخاب_د متن رشته
سوال/ساقه متن رشته
turkIdAnonymized متن رشته
  • نقل قول :
@article{mihaylov2018can,
  title
={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author
={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal
={arXiv preprint arXiv:1809.02789},
  year
={2018}
}