trivia_qa

  • বর্ণনা :

TriviaqQA হল একটি রিডিং কম্প্রিহেনশন ডেটাসেট যাতে 650K প্রশ্ন-উত্তর-প্রমাণ ট্রিপল থাকে। TriviaqQA-তে 95K প্রশ্ন-উত্তর জোড়া রয়েছে যা ট্রিভিয়া উত্সাহীদের দ্বারা লিখিত এবং স্বাধীনভাবে সংগ্রহ করা প্রমাণ নথি, প্রতি প্রশ্নে গড়ে ছয়টি, যা প্রশ্নের উত্তর দেওয়ার জন্য উচ্চ মানের দূরবর্তী তত্ত্বাবধান প্রদান করে।

FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_value': Text(shape=(), dtype=string),
        'type': Text(shape=(), dtype=string),
        'value': Text(shape=(), dtype=string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'wiki_context': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_source': Text(shape=(), dtype=string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'rank': int32,
        'search_context': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'url': Text(shape=(), dtype=string),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উত্তর ফিচারসডিক্ট
উত্তর/উপানাপ ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
উত্তর/মিলিত_উইকি_সত্তা_নাম পাঠ্য স্ট্রিং
উত্তর/নর্মালাইজড_আলিয়াস ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম পাঠ্য স্ট্রিং
উত্তর/স্বাভাবিক_মান পাঠ্য স্ট্রিং
উত্তর/টাইপ পাঠ্য স্ট্রিং
উত্তর/মান পাঠ্য স্ট্রিং
entity_pages ক্রম
entity_pages/doc_source পাঠ্য স্ট্রিং
entity_pages/filename পাঠ্য স্ট্রিং
entity_pages/title পাঠ্য স্ট্রিং
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ পাঠ্য স্ট্রিং
প্রশ্ন পাঠ্য স্ট্রিং
প্রশ্ন_আইডি পাঠ্য স্ট্রিং
প্রশ্ন_উৎস পাঠ্য স্ট্রিং
অনুসন্ধান ফলাফল ক্রম
search_results/description পাঠ্য স্ট্রিং
search_results/filename পাঠ্য স্ট্রিং
search_results/rank টেনসর int32
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ পাঠ্য স্ট্রিং
search_results/title পাঠ্য স্ট্রিং
search_results/url পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa/rc (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।

  • ডাউনলোড সাইজ : 2.48 GiB

  • ডেটাসেটের আকার : 14.99 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 17,210
'train' 138,384
'validation' 18,669

trivia_qa/rc.nocontext

  • কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।

  • ডাউনলোড সাইজ : 2.48 GiB

  • ডেটাসেটের আকার : 196.84 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 17,210
'train' 138,384
'validation' 18,669

trivia_qa/আনফিল্টার করা

  • কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।

  • ডাউনলোড আকার : 3.07 GiB

  • ডেটাসেটের আকার : 27.27 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 10,832
'train' ৮৭,৬২২
'validation' 11,313

trivia_qa/unfiltered.nocontext

  • কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।

  • ডাউনলোড সাইজ : 603.25 MiB

  • ডেটাসেটের আকার : 119.78 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 10,832
'train' ৮৭,৬২২
'validation' 11,313
,

  • বর্ণনা :

TriviaqQA হল একটি রিডিং কম্প্রিহেনশন ডেটাসেট যাতে 650K প্রশ্ন-উত্তর-প্রমাণ ট্রিপল থাকে। TriviaqQA-তে 95K প্রশ্ন-উত্তর জোড়া রয়েছে যা ট্রিভিয়া উত্সাহীদের দ্বারা লিখিত এবং স্বাধীনভাবে সংগ্রহ করা প্রমাণ নথি, প্রতি প্রশ্নে গড়ে ছয়টি, যা প্রশ্নের উত্তর দেওয়ার জন্য উচ্চ মানের দূরবর্তী তত্ত্বাবধান প্রদান করে।

FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_value': Text(shape=(), dtype=string),
        'type': Text(shape=(), dtype=string),
        'value': Text(shape=(), dtype=string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'wiki_context': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_source': Text(shape=(), dtype=string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'rank': int32,
        'search_context': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'url': Text(shape=(), dtype=string),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উত্তর ফিচারসডিক্ট
উত্তর/উপানাপ ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
উত্তর/মিলিত_উইকি_সত্তা_নাম পাঠ্য স্ট্রিং
উত্তর/নর্মালাইজড_আলিয়াস ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম পাঠ্য স্ট্রিং
উত্তর/স্বাভাবিক_মান পাঠ্য স্ট্রিং
উত্তর/টাইপ পাঠ্য স্ট্রিং
উত্তর/মান পাঠ্য স্ট্রিং
entity_pages ক্রম
entity_pages/doc_source পাঠ্য স্ট্রিং
entity_pages/filename পাঠ্য স্ট্রিং
entity_pages/title পাঠ্য স্ট্রিং
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ পাঠ্য স্ট্রিং
প্রশ্ন পাঠ্য স্ট্রিং
প্রশ্ন_আইডি পাঠ্য স্ট্রিং
প্রশ্ন_উৎস পাঠ্য স্ট্রিং
অনুসন্ধান ফলাফল ক্রম
search_results/description পাঠ্য স্ট্রিং
search_results/filename পাঠ্য স্ট্রিং
search_results/rank টেনসর int32
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ পাঠ্য স্ট্রিং
search_results/title পাঠ্য স্ট্রিং
search_results/url পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa/rc (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।

  • ডাউনলোড সাইজ : 2.48 GiB

  • ডেটাসেটের আকার : 14.99 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 17,210
'train' 138,384
'validation' 18,669

trivia_qa/rc.nocontext

  • কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।

  • ডাউনলোড সাইজ : 2.48 GiB

  • ডেটাসেটের আকার : 196.84 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 17,210
'train' 138,384
'validation' 18,669

trivia_qa/আনফিল্টার করা

  • কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।

  • ডাউনলোড আকার : 3.07 GiB

  • ডেটাসেটের আকার : 27.27 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 10,832
'train' ৮৭,৬২২
'validation' 11,313

trivia_qa/unfiltered.nocontext

  • কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।

  • ডাউনলোড সাইজ : 603.25 MiB

  • ডেটাসেটের আকার : 119.78 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 10,832
'train' ৮৭,৬২২
'validation' 11,313