mctaco

  • Deskripsi :

MC-TACO adalah kumpulan data dari 13k pasangan pertanyaan-jawaban yang membutuhkan pemahaman akal sehat temporal. Dataset berisi lima properti temporal:

  1. durasi (berapa lama waktu yang dibutuhkan suatu acara)
  2. pemesanan temporal (urutan khas peristiwa)
  3. waktu yang khas (ketika suatu peristiwa terjadi)
  4. frekuensi (seberapa sering suatu peristiwa terjadi)
  5. stasioneritas (apakah suatu keadaan dipertahankan untuk waktu yang sangat lama atau tanpa batas waktu)

Kami berharap kumpulan data ini dapat mempromosikan eksplorasi masa depan dari kelas masalah penalaran khusus ini.

Membelah Contoh
'test' 9.442
'validation' 3.783
  • Struktur fitur :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
menjawab Teks rangkaian
kategori LabelKelas int64
label LabelKelas int64
pertanyaan Teks rangkaian
kalimat Teks rangkaian
  • Kutipan :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}