wiki_bio

  • Mô tả :

WikiBio được xây dựng bằng cách sử dụng các trang tiểu sử Wikipedia, nó chứa đoạn đầu tiên và hộp thông tin được mã hóa. Bộ dữ liệu tuân theo định dạng bảng được chuẩn hóa.

Tách ra ví dụ
'test' 72,831
'train' 582.659
'validation' 72,831
  • Cấu trúc tính năng :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhập ký tự Tính năngDict
input_text/bối cảnh tenxơ sợi dây
input_text/bảng Sự phối hợp
input_text/table/column_header tenxơ sợi dây
input_text/bảng/nội dung tenxơ sợi dây
input_text/table/row_number tenxơ int16
văn bản đích tenxơ sợi dây
  • trích dẫn :
@inproceedings{lebret-etal-2016-neural,
    title = "Neural Text Generation from Structured Data with Application to the Biography Domain",
    author = "Lebret, R{'e}mi  and
      Grangier, David  and
      Auli, Michael",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D16-1128",
    doi = "10.18653/v1/D16-1128",
    pages = "1203--1213",
}