web_nlg

  • বর্ণনা :

ডেটাতে (DBpedia)[ https://wiki.dbpedia.org/ ] থেকে নিষ্কাশিত বিষয়-প্রেডিকেট-অবজেক্ট ফর্মের 1 থেকে 7 ট্রিপলের সেট রয়েছে এবং এই ট্রিপলগুলির একটি মৌখিক ভাষ্য। পরীক্ষার ডেটা 15টি ভিন্ন ডোমেন বিস্তৃত করে যেখানে প্রশিক্ষণ ডেটাতে শুধুমাত্র 10টি উপস্থিত হয়। ডেটাসেট একটি স্ট্যান্ডার্ড সারণী বিন্যাস অনুসরণ করে।

বিভক্ত উদাহরণ
'test_all' 4,928
'test_unseen' 2,433
'train' 18,102
'validation' 2,268
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
   
'input_text': FeaturesDict({
       
'context': string,
       
'table': Sequence({
           
'column_header': string,
           
'content': string,
           
'row_number': int16,
       
}),
   
}),
   
'target_text': string,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
input_text ফিচারসডিক্ট
ইনপুট_টেক্সট/প্রসঙ্গ টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল ক্রম
ইনপুট_টেক্সট/টেবিল/কলাম_হেডার টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সামগ্রী টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সারি_সংখ্যা টেনসর int16
টার্গেট_টেক্সট টেনসর স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{gardent2017creating,
    title
= ""Creating Training Corpora for {NLG} Micro-Planners"",
    author
= ""Gardent, Claire  and
     
Shimorina, Anastasia  and
     
Narayan, Shashi  and
     
Perez-Beltrachini, Laura"",
    booktitle
= ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month
= jul,
    year
= ""2017"",
    address
= ""Vancouver, Canada"",
    publisher
= ""Association for Computational Linguistics"",
    doi
= ""10.18653/v1/P17-1017"",
    pages
= ""179--188"",
    url
= ""https://www.aclweb.org/anthology/P17-1017.pdf""
}