qasc

  • विवरण :

क्यूएएससी एक प्रश्न-उत्तर डेटासेट है जो वाक्य रचना पर ध्यान केंद्रित करता है। इसमें ग्रेड स्कूल साइंस (8,134 ट्रेन, 926 देव, 920 टेस्ट) के बारे में 9,980 8-वे बहुविकल्पीय प्रश्न शामिल हैं, और यह 17M वाक्यों के संग्रह के साथ आता है।

विभाजित करना उदाहरण
'test' 920
'train' 8,134
'validation' 926
  • फ़ीचर संरचना :
FeaturesDict({
   
'answerKey': Text(shape=(), dtype=string),
   
'choices': Sequence({
       
'label': Text(shape=(), dtype=string),
       
'text': Text(shape=(), dtype=string),
   
}),
   
'combinedfact': Text(shape=(), dtype=string),
   
'fact1': Text(shape=(), dtype=string),
   
'fact2': Text(shape=(), dtype=string),
   
'formatted_question': Text(shape=(), dtype=string),
   
'id': Text(shape=(), dtype=string),
   
'question': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
उत्तर कुंजी मूलपाठ डोरी
विकल्प क्रम
विकल्प / लेबल मूलपाठ डोरी
विकल्प / पाठ मूलपाठ डोरी
संयुक्ततथ्य मूलपाठ डोरी
तथ्य1 मूलपाठ डोरी
तथ्य2 मूलपाठ डोरी
formatted_question मूलपाठ डोरी
पहचान मूलपाठ डोरी
प्रश्न मूलपाठ डोरी
  • उद्धरण :
@article{allenai:qasc,
      author    
= {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title    
= {QASC: A Dataset for Question Answering via Sentence Composition},
      journal  
= {arXiv:1910.11473v2},
      year      
= {2020},
}