web_questions

  • Mô tả :

Bộ dữ liệu này bao gồm 6.642 cặp câu hỏi / câu trả lời. Các câu hỏi được cho là có thể trả lời được bởi Freebase, một biểu đồ kiến ​​thức lớn. Các câu hỏi chủ yếu xoay quanh một thực thể được đặt tên duy nhất. Các câu hỏi là những câu hỏi phổ biến được hỏi trên web (ít nhất là trong năm 2013).

Tách ra Các ví dụ
'test' 2.032
'train' 3.778
  • Cấu trúc tính năng :
FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'question': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
câu trả lời Trình tự (Văn bản) (Không có,) tf.string
câu hỏi Bản văn tf.string
url Bản văn tf.string
  • Trích dẫn :
@inproceedings{berant-etal-2013-semantic,
    title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
    author = "Berant, Jonathan  and
      Chou, Andrew  and
      Frostig, Roy  and
      Liang, Percy",
    booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
    month = oct,
    year = "2013",
    address = "Seattle, Washington, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D13-1160",
    pages = "1533--1544",
}