openbookqa

  • Mô tả :

Bộ dữ liệu gồm 5.957 câu hỏi trắc nghiệm 4 chiều. Ngoài ra, chúng cung cấp 5.167 sự kiện kiến ​​thức phổ biến có nguồn gốc từ đám đông và một phiên bản mở rộng của câu hỏi đào tạo/nhà phát triển/kiểm tra trong đó mỗi câu hỏi được liên kết với sự kiện cốt lõi ban đầu, điểm chính xác của con người, điểm rõ ràng và nhân viên đám đông ẩn danh TÔI.

Tách ra ví dụ
'test' 500
'train' 4,957
'validation' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
câu trả lờiKey LớpNhãn int64
trong trẻo tenxơ phao32
sự thật1 Chữ sợi dây
con người tenxơ phao32
câu hỏi Tính năngDict
câu hỏi/lựa chọn_A Chữ sợi dây
câu hỏi/lựa chọn_B Chữ sợi dây
câu hỏi/lựa chọn_C Chữ sợi dây
câu hỏi/lựa chọn_D Chữ sợi dây
câu hỏi / gốc Chữ sợi dây
turkIdAnonymized Chữ sợi dây
  • trích dẫn :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}