- Mô tả:
Cosmos QA là một tập dữ liệu quy mô lớn gồm 35,6 nghìn bài toán yêu cầu khả năng đọc hiểu dựa trên ý nghĩa chung, được xây dựng dưới dạng các câu hỏi trắc nghiệm. Nó tập trung vào việc đọc giữa các dòng qua một bộ sưu tập đa dạng các câu chuyện hàng ngày của mọi người, đặt các câu hỏi liên quan đến nguyên nhân hoặc tác động có thể xảy ra của các sự kiện đòi hỏi suy luận ngoài các đoạn văn bản chính xác trong ngữ cảnh.
Trang chủ: https://wilburone.github.io/cosmos/
Source code:
tfds.question_answering.CosmosQA
phiên bản:
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Dung lượng tải về:
23.27 MiB
Dataset kích thước:
27.09 MiB
Tự động lưu trữ ( tài liệu ): Có
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 6.963 |
'train' | 25.262 |
'validation' | 2.985 |
- Các tính năng:
FeaturesDict({
'answer0': Text(shape=(), dtype=tf.string),
'answer1': Text(shape=(), dtype=tf.string),
'answer2': Text(shape=(), dtype=tf.string),
'answer3': Text(shape=(), dtype=tf.string),
'context': Text(shape=(), dtype=tf.string),
'id': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'question': Text(shape=(), dtype=tf.string),
})
Phím giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}