cosmos_qa

  • Mô tả:

Cosmos QA là một tập dữ liệu quy mô lớn gồm 35,6 nghìn bài toán yêu cầu khả năng đọc hiểu dựa trên ý nghĩa chung, được xây dựng dưới dạng các câu hỏi trắc nghiệm. Nó tập trung vào việc đọc giữa các dòng qua một bộ sưu tập đa dạng các câu chuyện hàng ngày của mọi người, đặt các câu hỏi liên quan đến nguyên nhân hoặc tác động có thể xảy ra của các sự kiện đòi hỏi suy luận ngoài các đoạn văn bản chính xác trong ngữ cảnh.

Tách ra Các ví dụ
'test' 6.963
'train' 25.262
'validation' 2.985
  • Các tính năng:
FeaturesDict({
    'answer0': Text(shape=(), dtype=tf.string),
    'answer1': Text(shape=(), dtype=tf.string),
    'answer2': Text(shape=(), dtype=tf.string),
    'answer3': Text(shape=(), dtype=tf.string),
    'context': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'question': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@inproceedings{huang-etal-2019-cosmos,
    title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
    author = "Huang, Lifu  and
      Le Bras, Ronan  and
      Bhagavatula, Chandra  and
      Choi, Yejin",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    year = "2019",
    url = "https://www.aclweb.org/anthology/D19-1243"
}