web_nlg

 • Mô tả:

Các dữ liệu chứa bộ 1-7 gấp ba dạng đối tượng-ngữ-đối tượng chiết xuất từ (dbpedia) [ https://wiki.dbpedia.org/ ] và văn bản ngôn ngữ tự nhiên đó là một verbalisation những ba. Dữ liệu kiểm tra trải dài 15 miền khác nhau trong đó chỉ có 10 miền xuất hiện trong dữ liệu đào tạo. Tập dữ liệu tuân theo định dạng bảng độc lập.

Tách ra Các ví dụ
'test_all' 4.928
'test_unseen' 2.433
'train' 18.102
'validation' 2.268
 • Các tính năng:
FeaturesDict({
  'input_text': FeaturesDict({
    'context': tf.string,
    'table': Sequence({
      'column_header': tf.string,
      'content': tf.string,
      'row_number': tf.int16,
    }),
  }),
  'target_text': tf.string,
})
 • Trích dẫn:
@inproceedings{gardent2017creating,
  title = ""Creating Training Corpora for {NLG} Micro-Planners"",
  author = ""Gardent, Claire and
   Shimorina, Anastasia and
   Narayan, Shashi and
   Perez-Beltrachini, Laura"",
  booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
  month = jul,
  year = ""2017"",
  address = ""Vancouver, Canada"",
  publisher = ""Association for Computational Linguistics"",
  doi = ""10.18653/v1/P17-1017"",
  pages = ""179--188"",
  url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}