- Mô tả :
QASC là bộ dữ liệu trả lời câu hỏi tập trung vào thành phần câu. Nó bao gồm 9,980 câu hỏi trắc nghiệm 8 cách về khoa học cấp trường (8,134 train, 926 dev, 920 test) và đi kèm với kho ngữ liệu 17M câu.
Trang chủ : https://allenai.org/data/qasc
Mã nguồn :
tfds.question_answering.qasc.Qasc
Các phiên bản :
-
0.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.54 MiB
Kích thước tập dữ liệu :
6.61 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 920 |
'train' | 8.134 |
'validation' | 926 |
- Các tính năng :
FeaturesDict({
'answerKey': Text(shape=(), dtype=tf.string),
'choices': Sequence({
'label': Text(shape=(), dtype=tf.string),
'text': Text(shape=(), dtype=tf.string),
}),
'combinedfact': Text(shape=(), dtype=tf.string),
'fact1': Text(shape=(), dtype=tf.string),
'fact2': Text(shape=(), dtype=tf.string),
'formatted_question': Text(shape=(), dtype=tf.string),
'id': Text(shape=(), dtype=tf.string),
'question': Text(shape=(), dtype=tf.string),
})
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}