एमएलक्यूए

  • विवरण :

MLQA (बहुभाषी प्रश्न उत्तर डेटासेट) बहुभाषी प्रश्न उत्तर प्रदर्शन के मूल्यांकन के लिए एक बेंचमार्क डेटासेट है। डेटासेट में 7 भाषाएँ हैं: अरबी, जर्मन, स्पेनिश, अंग्रेजी, हिंदी, वियतनामी, चीनी।

FeaturesDict({
   
'answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'context': Text(shape=(), dtype=string),
   
'id': string,
   
'question': Text(shape=(), dtype=string),
   
'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
जवाब अनुक्रम
उत्तर/जवाब_शुरू टेन्सर int32
उत्तर/पाठ मूलपाठ डोरी
प्रसंग मूलपाठ डोरी
पहचान टेन्सर डोरी
सवाल मूलपाठ डोरी
शीर्षक मूलपाठ डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{lewis2019mlqa,
  title
={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author
={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal
={arXiv preprint arXiv:1910.07475},
  year
={2019}
}

mlqa/ar (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • विन्यास विवरण : MLQA 'ar' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 9.28 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,335
'validation' 517

एमएलक्यूए/डी

  • विन्यास विवरण : एमएलक्यूए 'डी' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 5.06 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 4,517
'validation' 512

एमएलक्यूए/एन

  • कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'एन' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 15.72 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 11,590
'validation' 1,148

एमएलक्यूए/तों

  • कॉन्फ़िगरेशन विवरण : MLQA 'es' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 5.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,253
'validation' 500

एमएलक्यूए/हाय

  • कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'हाय' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 12.83 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 4,918
'validation' 507

एमएलक्यूए/vi

  • विन्यास विवरण : MLQA 'vi' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 8.77 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,495
'validation' 511

mlqa/zh

  • कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'जेएच' देव और परीक्षण विभाजन।

  • डेटासेट का आकार : 5.13 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,137
'validation' 504