wiki_table_questions

  • Mô tả :

Bộ dữ liệu chứa các cặp bảng-câu hỏi và câu trả lời tương ứng. Các câu hỏi yêu cầu suy luận nhiều bước và các thao tác dữ liệu khác nhau như so sánh, tổng hợp và tính toán số học. Các bảng được chọn ngẫu nhiên trong số các bảng Wikipedia có ít nhất 8 hàng và 5 cột.

(Theo ghi chú sử dụng tài liệu)

Tách ra ví dụ
'split-1-dev' 2.810
'split-1-train' 11,321
'split-2-dev' 2.838
'split-2-train' 11,312
'split-3-dev' 2.838
'split-3-train' 11,311
'test' 4.344
'train' 14,149
  • Cấu trúc tính năng :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhập ký tự Tính năngDict
input_text/bối cảnh tenxơ sợi dây
input_text/bảng Sự phối hợp
input_text/table/column_header tenxơ sợi dây
input_text/bảng/nội dung tenxơ sợi dây
input_text/table/row_number tenxơ int16
văn bản đích tenxơ sợi dây
  • trích dẫn :
@inproceedings{pasupat-liang-2015-compositional,
    title = "Compositional Semantic Parsing on Semi-Structured Tables",
    author = "Pasupat, Panupong  and
      Liang, Percy",
    booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
    month = jul,
    year = "2015",
    address = "Beijing, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P15-1142",
    doi = "10.3115/v1/P15-1142",
    pages = "1470--1480",
}