web_nlg

  • Açıklama :

Veriler, (DBpedia)[ https://wiki.dbpedia.org/ ] 'dan çıkarılan özne-yüklem-nesne biçimindeki 1 ila 7 üçlü kümeleri ve bu üçlülerin sözlü hali olan doğal dil metnini içerir. Test verileri, eğitim verilerinde yalnızca 10'unun göründüğü 15 farklı alanı kapsar. Veri kümesi, standartlaştırılmış bir tablo biçimini izler.

Bölmek örnekler
'test_all' 4.928
'test_unseen' 2.433
'train' 18.102
'validation' 2.268
  • Özellik yapısı :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
giriş metni ÖzelliklerDict
girdi_metni/bağlam tensör sicim
girdi_metni/tablo Sekans
girdi_metni/tablo/sütun_başlığı tensör sicim
girdi_metni/tablo/içerik tensör sicim
girdi_metni/tablo/satır_numarası tensör int16
hedef_metin tensör sicim
  • Alıntı :
@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}