উইকি_টেবিল_টেক্সট

  • বর্ণনা :

কমপক্ষে 3টি সারি এবং 2টি কলাম সহ উইকিপিডিয়া টেবিল, প্রতিটি টেবিলের জন্য 3টি এলোমেলো সারি আরও টীকা দেওয়ার জন্য নির্বাচন করা হয়েছে৷ প্রতিটি সারি একটি ভিন্ন ব্যক্তি দ্বারা টীকা করা হয়েছে, তাই ডেটাসেটটি (এক সারি টেবিল, পাঠ্য বিবরণ) জোড়া দ্বারা গঠিত। টীকাগুলি সারির কমপক্ষে 2টি ঘর অন্তর্ভুক্ত করে, কিন্তু সেগুলিকে অন্তর্ভুক্ত করার প্রয়োজন নেই৷ ডেটাসেট একটি স্ট্যান্ডার্ড সারণী বিন্যাস অনুসরণ করে।

বিভক্ত উদাহরণ
'test' 2,000
'train' 10,000
'validation' 1,318
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
input_text ফিচারসডিক্ট
ইনপুট_টেক্সট/টেবিল ক্রম
ইনপুট_টেক্সট/টেবিল/কলাম_হেডার টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সামগ্রী টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সারি_সংখ্যা টেনসর int16
টার্গেট_টেক্সট টেনসর স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}