- বর্ণনা :
কমপক্ষে 3টি সারি এবং 2টি কলাম সহ উইকিপিডিয়া টেবিল, প্রতিটি টেবিলের জন্য 3টি এলোমেলো সারি আরও টীকা দেওয়ার জন্য নির্বাচন করা হয়েছে৷ প্রতিটি সারি একটি ভিন্ন ব্যক্তি দ্বারা টীকা করা হয়েছে, তাই ডেটাসেটটি (এক সারি টেবিল, পাঠ্য বিবরণ) জোড়া দ্বারা গঠিত। টীকাগুলি সারির কমপক্ষে 2টি ঘর অন্তর্ভুক্ত করে, কিন্তু সেগুলিকে অন্তর্ভুক্ত করার প্রয়োজন নেই৷ ডেটাসেট একটি স্ট্যান্ডার্ড সারণী বিন্যাস অনুসরণ করে।
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড আকার :
3.70 MiB
ডেটাসেটের আকার :
4.64 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 10,000 |
'validation' | 1,318 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
input_text | ফিচারসডিক্ট | |||
ইনপুট_টেক্সট/টেবিল | ক্রম | |||
ইনপুট_টেক্সট/টেবিল/কলাম_হেডার | টেনসর | স্ট্রিং | ||
ইনপুট_টেক্সট/টেবিল/সামগ্রী | টেনসর | স্ট্রিং | ||
ইনপুট_টেক্সট/টেবিল/সারি_সংখ্যা | টেনসর | int16 | ||
টার্গেট_টেক্সট | টেনসর | স্ট্রিং |
তত্ত্বাবধান করা কী (
as_supervised
ডক হিসেবে ):('input_text', 'target_text')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}