web_questions

  • Mô tả :

Bộ dữ liệu này bao gồm 6.642 cặp câu hỏi/câu trả lời. Các câu hỏi được cho là có thể trả lời được bằng Freebase, một biểu đồ tri thức lớn. Các câu hỏi chủ yếu xoay quanh một thực thể được đặt tên duy nhất. Các câu hỏi là những câu hỏi phổ biến trên web (ít nhất là vào năm 2013).

Tách ra ví dụ
'test' 2.032
'train' 3,778
  • Cấu trúc tính năng :
FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'question': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
câu trả lời Trình tự (Văn bản) (Không có,) sợi dây
câu hỏi Chữ sợi dây
url Chữ sợi dây
  • trích dẫn :
@inproceedings{berant-etal-2013-semantic,
    title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
    author = "Berant, Jonathan  and
      Chou, Andrew  and
      Frostig, Roy  and
      Liang, Percy",
    booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
    month = oct,
    year = "2013",
    address = "Seattle, Washington, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D13-1160",
    pages = "1533--1544",
}