- Mô tả :
Bộ dữ liệu chứa các cặp bảng-câu hỏi và câu trả lời tương ứng. Các câu hỏi yêu cầu suy luận nhiều bước và các thao tác dữ liệu khác nhau như so sánh, tổng hợp và tính toán số học. Các bảng được chọn ngẫu nhiên trong số các bảng Wikipedia có ít nhất 8 hàng và 5 cột.
(Theo ghi chú sử dụng tài liệu)
Nhà phát triển: Độ chính xác trung bình trên ba (không phải năm) lần phân chia dữ liệu huấn luyện. Nói cách khác, huấn luyện trên 'split-{1,2,3}-train' và thử nghiệm trên 'split-{1,2,3}-dev', tương ứng, sau đó lấy trung bình độ chính xác.
Kiểm tra: Đào tạo trên 'đào tạo' và kiểm tra trên 'bài kiểm tra'.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Mã nguồn :
tfds.structured.wiki_table_questions.WikiTableQuestions
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
65.36 MiB
Kích thước tập dữ liệu :
237.24 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'split-1-dev' | 2.810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2.838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2.838 |
'split-3-train' | 11,311 |
'test' | 4.344 |
'train' | 14,149 |
- Cấu trúc tính năng :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
nhập ký tự | Tính năngDict | |||
input_text/bối cảnh | tenxơ | sợi dây | ||
input_text/bảng | Sự phối hợp | |||
input_text/table/column_header | tenxơ | sợi dây | ||
input_text/bảng/nội dung | tenxơ | sợi dây | ||
input_text/table/row_number | tenxơ | int16 | ||
văn bản đích | tenxơ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('input_text', 'target_text')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}