web_nlg

  • Mô tả:

Các dữ liệu chứa bộ 1-7 gấp ba dạng đối tượng-ngữ-đối tượng chiết xuất từ (dbpedia) [ https://wiki.dbpedia.org/ ] và văn bản ngôn ngữ tự nhiên đó là một verbalisation những ba. Dữ liệu kiểm tra trải dài 15 miền khác nhau trong đó chỉ có 10 miền xuất hiện trong dữ liệu đào tạo. Tập dữ liệu tuân theo định dạng bảng độc lập.

Tách ra Các ví dụ
'test_all' 4.928
'test_unseen' 2.433
'train' 18.102
'validation' 2.268
  • Các tính năng:
FeaturesDict({
    'input_text': FeaturesDict({
        'context': tf.string,
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • Trích dẫn:
@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}