trivia_qa

বর্ণনা :

TriviaqQA হল একটি রিডিং কম্প্রিহেনশন ডেটাসেট যাতে 650K প্রশ্ন-উত্তর-প্রমাণ ট্রিপল থাকে। TriviaqQA-তে 95K প্রশ্ন-উত্তর জোড়া রয়েছে যা ট্রিভিয়া উত্সাহীদের দ্বারা লিখিত এবং স্বাধীনভাবে সংগ্রহ করা প্রমাণ নথি, প্রতি প্রশ্নে গড়ে ছয়টি, যা প্রশ্নের উত্তর দেওয়ার জন্য উচ্চ মানের দূরবর্তী তত্ত্বাবধান প্রদান করে।

অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : http://nlp.cs.washington.edu/triviaqa/
সোর্স কোড : tfds.datasets.trivia_qa.Builder
সংস্করণ :
- 1.1.0 (ডিফল্ট): কোনো রিলিজ নোট নেই।
বৈশিষ্ট্য গঠন :

FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_value': Text(shape=(), dtype=string),
        'type': Text(shape=(), dtype=string),
        'value': Text(shape=(), dtype=string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'wiki_context': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_source': Text(shape=(), dtype=string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'rank': int32,
        'search_context': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'url': Text(shape=(), dtype=string),
    }),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ
	ফিচারসডিক্ট
উত্তর	ফিচারসডিক্ট
উত্তর/উপানাপ	ক্রম (পাঠ্য)	(কোনটিই নয়,)	স্ট্রিং
উত্তর/মিলিত_উইকি_সত্তা_নাম	পাঠ্য		স্ট্রিং
উত্তর/নর্মালাইজড_আলিয়াস	ক্রম (পাঠ্য)	(কোনটিই নয়,)	স্ট্রিং
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম	পাঠ্য		স্ট্রিং
উত্তর/স্বাভাবিক_মান	পাঠ্য		স্ট্রিং
উত্তর/টাইপ	পাঠ্য		স্ট্রিং
উত্তর/মান	পাঠ্য		স্ট্রিং
entity_pages	ক্রম
entity_pages/doc_source	পাঠ্য		স্ট্রিং
entity_pages/filename	পাঠ্য		স্ট্রিং
entity_pages/title	পাঠ্য		স্ট্রিং
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ	পাঠ্য		স্ট্রিং
প্রশ্ন	পাঠ্য		স্ট্রিং
প্রশ্ন_আইডি	পাঠ্য		স্ট্রিং
প্রশ্ন_উৎস	পাঠ্য		স্ট্রিং
অনুসন্ধান ফলাফল	ক্রম
search_results/description	পাঠ্য		স্ট্রিং
search_results/filename	পাঠ্য		স্ট্রিং
search_results/rank	টেনসর		int32
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ	পাঠ্য		স্ট্রিং
search_results/title	পাঠ্য		স্ট্রিং
search_results/url	পাঠ্য		স্ট্রিং

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :

@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa/rc (ডিফল্ট কনফিগারেশন)

কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড সাইজ : 2.48 GiB
ডেটাসেটের আকার : 14.99 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	17,210
`'train'`	138,384
`'validation'`	18,669

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/rc.nocontext

কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।
ডাউনলোড সাইজ : 2.48 GiB
ডেটাসেটের আকার : 196.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	17,210
`'train'`	138,384
`'validation'`	18,669

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/আনফিল্টার করা

কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড আকার : 3.07 GiB
ডেটাসেটের আকার : 27.27 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	10,832
`'train'`	৮৭,৬২২
`'validation'`	11,313

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/unfiltered.nocontext

কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।
ডাউনলোড সাইজ : 603.25 MiB
ডেটাসেটের আকার : 119.78 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	10,832
`'train'`	৮৭,৬২২
`'validation'`	11,313

উদাহরণ ( tfds.as_dataframe ):

বর্ণনা :

অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : http://nlp.cs.washington.edu/triviaqa/
সোর্স কোড : tfds.datasets.trivia_qa.Builder
সংস্করণ :
- 1.1.0 (ডিফল্ট): কোনো রিলিজ নোট নেই।
বৈশিষ্ট্য গঠন :

FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
        'normalized_value': Text(shape=(), dtype=string),
        'type': Text(shape=(), dtype=string),
        'value': Text(shape=(), dtype=string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'wiki_context': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_source': Text(shape=(), dtype=string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=string),
        'filename': Text(shape=(), dtype=string),
        'rank': int32,
        'search_context': Text(shape=(), dtype=string),
        'title': Text(shape=(), dtype=string),
        'url': Text(shape=(), dtype=string),
    }),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ
	ফিচারসডিক্ট
উত্তর	ফিচারসডিক্ট
উত্তর/উপানাপ	ক্রম (পাঠ্য)	(কোনটিই নয়,)	স্ট্রিং
উত্তর/মিলিত_উইকি_সত্তা_নাম	পাঠ্য		স্ট্রিং
উত্তর/নর্মালাইজড_আলিয়াস	ক্রম (পাঠ্য)	(কোনটিই নয়,)	স্ট্রিং
উত্তর/স্বাভাবিক_মিলিত_উইকি_সত্তা_নাম	পাঠ্য		স্ট্রিং
উত্তর/স্বাভাবিক_মান	পাঠ্য		স্ট্রিং
উত্তর/টাইপ	পাঠ্য		স্ট্রিং
উত্তর/মান	পাঠ্য		স্ট্রিং
entity_pages	ক্রম
entity_pages/doc_source	পাঠ্য		স্ট্রিং
entity_pages/filename	পাঠ্য		স্ট্রিং
entity_pages/title	পাঠ্য		স্ট্রিং
সত্তা_পৃষ্ঠা/উইকি_প্রসঙ্গ	পাঠ্য		স্ট্রিং
প্রশ্ন	পাঠ্য		স্ট্রিং
প্রশ্ন_আইডি	পাঠ্য		স্ট্রিং
প্রশ্ন_উৎস	পাঠ্য		স্ট্রিং
অনুসন্ধান ফলাফল	ক্রম
search_results/description	পাঠ্য		স্ট্রিং
search_results/filename	পাঠ্য		স্ট্রিং
search_results/rank	টেনসর		int32
সার্চ_ফলাফল/অনুসন্ধান_প্রসঙ্গ	পাঠ্য		স্ট্রিং
search_results/title	পাঠ্য		স্ট্রিং
search_results/url	পাঠ্য		স্ট্রিং

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :

@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa/rc (ডিফল্ট কনফিগারেশন)

কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড সাইজ : 2.48 GiB
ডেটাসেটের আকার : 14.99 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	17,210
`'train'`	138,384
`'validation'`	18,669

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/rc.nocontext

কনফিগার বিবরণ : প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে।
ডাউনলোড সাইজ : 2.48 GiB
ডেটাসেটের আকার : 196.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	17,210
`'train'`	138,384
`'validation'`	18,669

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/আনফিল্টার করা

কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে। উইকিপিডিয়া এবং অনুসন্ধান ফলাফল থেকে প্রসঙ্গ অন্তর্ভুক্ত।
ডাউনলোড আকার : 3.07 GiB
ডেটাসেটের আকার : 27.27 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	10,832
`'train'`	৮৭,৬২২
`'validation'`	11,313

উদাহরণ ( tfds.as_dataframe ):

trivia_qa/unfiltered.nocontext

কনফিগার বিবরণ : খোলা ডোমেন QA-এর জন্য 110k প্রশ্ন-উত্তর জোড়া যেখানে একটি প্রদত্ত প্রশ্নের জন্য সমস্ত নথিতে উত্তর স্ট্রিং(গুলি) থাকে না। এটি IR-শৈলী QA-এর জন্য আনফিল্টার করা ডেটাসেটকে আরও উপযুক্ত করে তোলে।
ডাউনলোড সাইজ : 603.25 MiB
ডেটাসেটের আকার : 119.78 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	10,832
`'train'`	৮৭,৬২২
`'validation'`	11,313

উদাহরণ ( tfds.as_dataframe ):