qasc

  • Mô tả :

QASC là bộ dữ liệu trả lời câu hỏi tập trung vào thành phần câu. Nó bao gồm 9,980 câu hỏi trắc nghiệm 8 cách về khoa học cấp trường (8,134 train, 926 dev, 920 test) và đi kèm với kho ngữ liệu 17M câu.

Tách ra Các ví dụ
'test' 920
'train' 8.134
'validation' 926
  • Các tính năng :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=tf.string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=tf.string),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'combinedfact': Text(shape=(), dtype=tf.string),
    'fact1': Text(shape=(), dtype=tf.string),
    'fact2': Text(shape=(), dtype=tf.string),
    'formatted_question': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}