openbookqa

  • Mô tả:

Bộ dữ liệu chứa 5.957 câu hỏi trắc nghiệm 4 chiều. Ngoài ra, chúng cung cấp 5.167 thông tin thực tế về kiến ​​thức chung có nguồn gốc từ cộng đồng và phiên bản mở rộng của câu hỏi đào tạo / nhà phát triển / kiểm tra trong đó mỗi câu hỏi được liên kết với thực tế cốt lõi ban đầu, điểm chính xác của con người, điểm rõ ràng và nhân viên cộng đồng ẩn danh TÔI.

Tách ra Các ví dụ
'test' 500
'train' 4.957
'validation' 500
  • Các tính năng:
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'clarity': tf.float32,
    'fact1': Text(shape=(), dtype=tf.string),
    'humanScore': tf.float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=tf.string),
        'choice_B': Text(shape=(), dtype=tf.string),
        'choice_C': Text(shape=(), dtype=tf.string),
        'choice_D': Text(shape=(), dtype=tf.string),
        'stem': Text(shape=(), dtype=tf.string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}