- Mô tả:
Các bảng Wikipedia có ít nhất 3 hàng và 2 cột, 3 hàng ngẫu nhiên cho mỗi bảng đã được chọn để chú thích thêm. Mỗi hàng được chú thích bởi một người khác nhau, do đó, tập dữ liệu được tạo bởi các cặp (một bảng hàng, mô tả văn bản). Chú thích bao gồm ít nhất 2 ô của hàng, nhưng không yêu cầu phải bao gồm tất cả chúng. Tập dữ liệu tuân theo định dạng bảng độc lập.
Trang chủ: https://github.com/msra-nlc/Table2Text
Source code:
tfds.structured.wiki_table_text.WikiTableText
phiên bản:
-
1.0.0
(mặc định): Phiên bản đầu tiên.
-
Dung lượng tải về:
3.70 MiB
Dataset kích thước:
4.64 MiB
Tự động lưu trữ ( tài liệu ): Có
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 2.000 |
'train' | 10.000 |
'validation' | 1.318 |
- Các tính năng:
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': tf.string,
'content': tf.string,
'row_number': tf.int16,
}),
}),
'target_text': tf.string,
})
Phím giám sát (Xem
as_supervised
doc ):('input_text', 'target_text')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}