mctaco

  • Mô tả:

MC-TACO là tập dữ liệu gồm 13k cặp câu hỏi-câu trả lời yêu cầu khả năng hiểu thông thường theo thời gian. Tập dữ liệu chứa năm thuộc tính tạm thời:

  1. thời lượng (sự kiện diễn ra trong bao lâu)
  2. thứ tự thời gian (thứ tự điển hình của các sự kiện)
  3. thời gian điển hình (khi một sự kiện xảy ra)
  4. tần suất (tần suất một sự kiện xảy ra)
  5. sự cố định (cho dù một trạng thái được duy trì trong một thời gian rất dài hay vô thời hạn)

Chúng tôi hy vọng rằng tập dữ liệu này có thể thúc đẩy việc khám phá trong tương lai về loại vấn đề lý luận cụ thể này.

Tách ra Các ví dụ
'test' 9.442
'validation' 3.783
  • Các tính năng:
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}