openbookqa

  • תיאור :

מערך הנתונים מכיל 5,957 שאלות רב-ברירה ארבע כיווניות. בנוסף, הם מספקים 5,167 עובדות ידע נפוץ ממקור המונים, וגרסה מורחבת של שאלות הרכבת/פיתוח/מבחן, כאשר כל שאלה קשורה לעובדת הליבה המקורית שלה, ציון דיוק אנושי, ציון בהירות ועובד קהל אנונימי תְעוּדַת זֶהוּת.

לְפַצֵל דוגמאות
'test' 500
'train' 4,957
'validation' 500
  • מבנה תכונה :
FeaturesDict({
   
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'clarity': float32,
   
'fact1': Text(shape=(), dtype=string),
   
'humanScore': float32,
   
'question': FeaturesDict({
       
'choice_A': Text(shape=(), dtype=string),
       
'choice_B': Text(shape=(), dtype=string),
       
'choice_C': Text(shape=(), dtype=string),
       
'choice_D': Text(shape=(), dtype=string),
       
'stem': Text(shape=(), dtype=string),
   
}),
   
'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
מקש מענה ClassLabel int64
בְּהִירוּת מוֹתֵחַ לצוף32
עובדה 1 טֶקסט חוּט
humanScore מוֹתֵחַ לצוף32
שְׁאֵלָה FeaturesDict
שאלה/בחירה_א טֶקסט חוּט
שאלה/בחירה_ב טֶקסט חוּט
שאלה/בחירה_ג טֶקסט חוּט
שאלה/בחירה_D טֶקסט חוּט
שאלה/גזע טֶקסט חוּט
turkIdAnonymized טֶקסט חוּט
  • ציטוט :
@article{mihaylov2018can,
  title
={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author
={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal
={arXiv preprint arXiv:1809.02789},
  year
={2018}
}