kosmos_qa

  • Deskripsi :

Cosmos QA adalah kumpulan data skala besar dari 35,6 ribu masalah yang membutuhkan pemahaman bacaan berbasis akal sehat, yang diformulasikan sebagai pertanyaan pilihan ganda. Ini berfokus pada membaca yang tersirat atas beragam kumpulan narasi sehari-hari orang, mengajukan pertanyaan tentang kemungkinan penyebab atau efek dari peristiwa yang memerlukan penalaran di luar rentang teks yang tepat dalam konteks.

Membelah Contoh
'test' 6.963
'train' 25.262
'validation' 2.985
  • Struktur fitur :
FeaturesDict({
    'answer0': Text(shape=(), dtype=string),
    'answer1': Text(shape=(), dtype=string),
    'answer2': Text(shape=(), dtype=string),
    'answer3': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'question': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
jawaban0 Teks rangkaian
jawaban 1 Teks rangkaian
jawaban2 Teks rangkaian
jawaban3 Teks rangkaian
konteks Teks rangkaian
Indo Teks rangkaian
label LabelKelas int64
pertanyaan Teks rangkaian
  • Kutipan :
@inproceedings{huang-etal-2019-cosmos,
    title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
    author = "Huang, Lifu  and
      Le Bras, Ronan  and
      Bhagavatula, Chandra  and
      Choi, Yejin",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    year = "2019",
    url = "https://www.aclweb.org/anthology/D19-1243"
}