qasc

  • תיאור :

QASC הוא מערך תשובות לשאלות עם התמקדות בהרכב משפטים. הוא מורכב מ-9,980 שאלות מרובות ברירות 8-כיווניות על מדעים של בית ספר תיכון (8,134 רכבת, 926 הפיתוח, מבחן 920), ומגיע עם קורפוס של 17 מיליון משפטים.

לְפַצֵל דוגמאות
'test' 920
'train' 8,134
'validation' 926
  • מבנה תכונה :
FeaturesDict({
   
'answerKey': Text(shape=(), dtype=string),
   
'choices': Sequence({
       
'label': Text(shape=(), dtype=string),
       
'text': Text(shape=(), dtype=string),
   
}),
   
'combinedfact': Text(shape=(), dtype=string),
   
'fact1': Text(shape=(), dtype=string),
   
'fact2': Text(shape=(), dtype=string),
   
'formatted_question': Text(shape=(), dtype=string),
   
'id': Text(shape=(), dtype=string),
   
'question': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
מקש מענה טֶקסט חוּט
בחירות סדר פעולות
בחירות/תווית טֶקסט חוּט
אפשרויות/טקסט טֶקסט חוּט
עובדה משולבת טֶקסט חוּט
עובדה 1 טֶקסט חוּט
עובדה 2 טֶקסט חוּט
formatted_question טֶקסט חוּט
תְעוּדַת זֶהוּת טֶקסט חוּט
שְׁאֵלָה טֶקסט חוּט
  • ציטוט :
@article{allenai:qasc,
      author    
= {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title    
= {QASC: A Dataset for Question Answering via Sentence Composition},
      journal  
= {arXiv:1910.11473v2},
      year      
= {2020},
}