- বর্ণনা :
TriviaqQA হল একটি রিডিং কম্প্রিহেনশন ডেটাসেট যাতে 650K প্রশ্ন-উত্তর-প্রমাণ ট্রিপল থাকে। TriviaqQA-তে 95K প্রশ্ন-উত্তর জোড়া রয়েছে যা ট্রিভিয়া উত্সাহীদের দ্বারা লিখিত এবং স্বাধীনভাবে সংগ্রহ করা প্রমাণ নথি, প্রতি প্রশ্নে গড়ে ছয়টি, যা প্রশ্নের উত্তর দেওয়ার জন্য উচ্চ মানের দূরবর্তী তত্ত্বাবধান প্রদান করে।
সোর্স কোড :
tfds.datasets.trivia_qa.Builder
সংস্করণ :
-
1.1.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': FeaturesDict({
'aliases': Sequence(Text(shape=(), dtype=string)),
'matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_value': Text(shape=(), dtype=string),
'type': Text(shape=(), dtype=string),
'value': Text(shape=(), dtype=string),
}),
'entity_pages': Sequence({
'doc_source': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'wiki_context': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'question_id': Text(shape=(), dtype=string),
'question_source': Text(shape=(), dtype=string),
'search_results': Sequence({
'description': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'rank': int32,
'search_context': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | ফিচারসডিক্ট | |||
উত্তর/উপানাপ | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
উত্তর/মিলিত_উইকি_সত্তা_নাম | পাঠ্য | স্ট্রিং | ||
উত্তর/নর্মালাইজড_আলিয়াস | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম | পাঠ্য | স্ট্রিং | ||
উত্তর/স্বাভাবিক_মান | পাঠ্য | স্ট্রিং | ||
উত্তর/টাইপ | পাঠ্য | স্ট্রিং | ||
উত্তর/মান | পাঠ্য | স্ট্রিং | ||
entity_pages | ক্রম | |||
entity_pages/doc_source | পাঠ্য | স্ট্রিং | ||
entity_pages/filename | পাঠ্য | স্ট্রিং | ||
entity_pages/title | পাঠ্য | স্ট্রিং | ||
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
প্রশ্ন_আইডি | পাঠ্য | স্ট্রিং | ||
প্রশ্ন_উৎস | পাঠ্য | স্ট্রিং | ||
অনুসন্ধান ফলাফল | ক্রম | |||
search_results/description | পাঠ্য | স্ট্রিং | ||
search_results/filename | পাঠ্য | স্ট্রিং | ||
search_results/rank | টেনসর | int32 | ||
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
search_results/title | পাঠ্য | স্ট্রিং | ||
search_results/url | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{2017arXivtriviaqa,
author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
Daniel and {Zettlemoyer}, Luke},
title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
journal = {arXiv e-prints},
year = 2017,
eid = {arXiv:1705.03551},
pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
eprint = {1705.03551},
}
trivia_qa/rc (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড সাইজ :
2.48 GiB
ডেটাসেটের আকার :
14.99 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/rc.nocontext
কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।
ডাউনলোড সাইজ :
2.48 GiB
ডেটাসেটের আকার :
196.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/আনফিল্টার করা
কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড আকার :
3.07 GiB
ডেটাসেটের আকার :
27.27 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 10,832 |
'train' | ৮৭,৬২২ |
'validation' | 11,313 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/unfiltered.nocontext
কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।
ডাউনলোড সাইজ :
603.25 MiB
ডেটাসেটের আকার :
119.78 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 10,832 |
'train' | ৮৭,৬২২ |
'validation' | 11,313 |
- উদাহরণ ( tfds.as_dataframe ):
- বর্ণনা :
TriviaqQA হল একটি রিডিং কম্প্রিহেনশন ডেটাসেট যাতে 650K প্রশ্ন-উত্তর-প্রমাণ ট্রিপল থাকে। TriviaqQA-তে 95K প্রশ্ন-উত্তর জোড়া রয়েছে যা ট্রিভিয়া উত্সাহীদের দ্বারা লিখিত এবং স্বাধীনভাবে সংগ্রহ করা প্রমাণ নথি, প্রতি প্রশ্নে গড়ে ছয়টি, যা প্রশ্নের উত্তর দেওয়ার জন্য উচ্চ মানের দূরবর্তী তত্ত্বাবধান প্রদান করে।
সোর্স কোড :
tfds.datasets.trivia_qa.Builder
সংস্করণ :
-
1.1.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': FeaturesDict({
'aliases': Sequence(Text(shape=(), dtype=string)),
'matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_value': Text(shape=(), dtype=string),
'type': Text(shape=(), dtype=string),
'value': Text(shape=(), dtype=string),
}),
'entity_pages': Sequence({
'doc_source': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'wiki_context': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'question_id': Text(shape=(), dtype=string),
'question_source': Text(shape=(), dtype=string),
'search_results': Sequence({
'description': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'rank': int32,
'search_context': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | ফিচারসডিক্ট | |||
উত্তর/উপানাপ | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
উত্তর/মিলিত_উইকি_সত্তা_নাম | পাঠ্য | স্ট্রিং | ||
উত্তর/নর্মালাইজড_আলিয়াস | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম | পাঠ্য | স্ট্রিং | ||
উত্তর/স্বাভাবিক_মান | পাঠ্য | স্ট্রিং | ||
উত্তর/টাইপ | পাঠ্য | স্ট্রিং | ||
উত্তর/মান | পাঠ্য | স্ট্রিং | ||
entity_pages | ক্রম | |||
entity_pages/doc_source | পাঠ্য | স্ট্রিং | ||
entity_pages/filename | পাঠ্য | স্ট্রিং | ||
entity_pages/title | পাঠ্য | স্ট্রিং | ||
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
প্রশ্ন_আইডি | পাঠ্য | স্ট্রিং | ||
প্রশ্ন_উৎস | পাঠ্য | স্ট্রিং | ||
অনুসন্ধান ফলাফল | ক্রম | |||
search_results/description | পাঠ্য | স্ট্রিং | ||
search_results/filename | পাঠ্য | স্ট্রিং | ||
search_results/rank | টেনসর | int32 | ||
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
search_results/title | পাঠ্য | স্ট্রিং | ||
search_results/url | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{2017arXivtriviaqa,
author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
Daniel and {Zettlemoyer}, Luke},
title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
journal = {arXiv e-prints},
year = 2017,
eid = {arXiv:1705.03551},
pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
eprint = {1705.03551},
}
trivia_qa/rc (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড সাইজ :
2.48 GiB
ডেটাসেটের আকার :
14.99 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/rc.nocontext
কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।
ডাউনলোড সাইজ :
2.48 GiB
ডেটাসেটের আকার :
196.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/আনফিল্টার করা
কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড আকার :
3.07 GiB
ডেটাসেটের আকার :
27.27 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 10,832 |
'train' | ৮৭,৬২২ |
'validation' | 11,313 |
- উদাহরণ ( tfds.as_dataframe ):
trivia_qa/unfiltered.nocontext
কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।
ডাউনলোড সাইজ :
603.25 MiB
ডেটাসেটের আকার :
119.78 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 10,832 |
'train' | ৮৭,৬২২ |
'validation' | 11,313 |
- উদাহরণ ( tfds.as_dataframe ):