- Mô tả :
Bộ dữ liệu gồm 5.957 câu hỏi trắc nghiệm 4 chiều. Ngoài ra, chúng cung cấp 5.167 sự kiện kiến thức phổ biến có nguồn gốc từ đám đông và một phiên bản mở rộng của câu hỏi đào tạo/nhà phát triển/kiểm tra trong đó mỗi câu hỏi được liên kết với sự kiện cốt lõi ban đầu, điểm chính xác của con người, điểm rõ ràng và nhân viên đám đông ẩn danh TÔI.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
Mã nguồn :
tfds.datasets.openbookqa.Builder
Phiên bản :
-
0.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.38 MiB
Kích thước tập dữ liệu :
2.40 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 500 |
'train' | 4,957 |
'validation' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lờiKey | LớpNhãn | int64 | ||
trong trẻo | tenxơ | phao32 | ||
sự thật1 | Chữ | sợi dây | ||
con người | tenxơ | phao32 | ||
câu hỏi | Tính năngDict | |||
câu hỏi/lựa chọn_A | Chữ | sợi dây | ||
câu hỏi/lựa chọn_B | Chữ | sợi dây | ||
câu hỏi/lựa chọn_C | Chữ | sợi dây | ||
câu hỏi/lựa chọn_D | Chữ | sợi dây | ||
câu hỏi / gốc | Chữ | sợi dây | ||
turkIdAnonymized | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('question', 'answerKey')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}