wiki_table_text

  • Mô tả:

Các bảng Wikipedia có ít nhất 3 hàng và 2 cột, 3 hàng ngẫu nhiên cho mỗi bảng đã được chọn để chú thích thêm. Mỗi hàng được chú thích bởi một người khác nhau, do đó, tập dữ liệu được tạo bởi các cặp (một bảng hàng, mô tả văn bản). Chú thích bao gồm ít nhất 2 ô của hàng, nhưng không yêu cầu phải bao gồm tất cả chúng. Tập dữ liệu tuân theo định dạng bảng độc lập.

Tách ra Các ví dụ
'test' 2.000
'train' 10.000
'validation' 1.318
  • Các tính năng:
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • Trích dẫn:
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}