- विवरण :
MLQA (बहुभाषी प्रश्न उत्तर डेटासेट) बहुभाषी प्रश्न उत्तर प्रदर्शन के मूल्यांकन के लिए एक बेंचमार्क डेटासेट है। डेटासेट में 7 भाषाएँ हैं: अरबी, जर्मन, स्पेनिश, अंग्रेजी, हिंदी, वियतनामी, चीनी।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
स्रोत कोड :
tfds.datasets.mlqa.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
72.21 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| जवाब | अनुक्रम | |||
| उत्तर/जवाब_शुरू | टेन्सर | int32 | ||
| उत्तर/पाठ | मूलपाठ | डोरी | ||
| प्रसंग | मूलपाठ | डोरी | ||
| पहचान | टेन्सर | डोरी | ||
| सवाल | मूलपाठ | डोरी | ||
| शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (डिफ़ॉल्ट कॉन्फ़िगरेशन)
विन्यास विवरण : MLQA 'ar' देव और परीक्षण विभाजन।
डेटासेट का आकार :
9.28 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 5,335 |
'validation' | 517 |
- उदाहरण ( tfds.as_dataframe ):
एमएलक्यूए/डी
विन्यास विवरण : एमएलक्यूए 'डी' देव और परीक्षण विभाजन।
डेटासेट का आकार :
5.06 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 4,517 |
'validation' | 512 |
- उदाहरण ( tfds.as_dataframe ):
एमएलक्यूए/एन
कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'एन' देव और परीक्षण विभाजन।
डेटासेट का आकार :
15.72 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 11,590 |
'validation' | 1,148 |
- उदाहरण ( tfds.as_dataframe ):
एमएलक्यूए/तों
कॉन्फ़िगरेशन विवरण : MLQA 'es' देव और परीक्षण विभाजन।
डेटासेट का आकार :
5.09 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 5,253 |
'validation' | 500 |
- उदाहरण ( tfds.as_dataframe ):
एमएलक्यूए/हाय
कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'हाय' देव और परीक्षण विभाजन।
डेटासेट का आकार :
12.83 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 4,918 |
'validation' | 507 |
- उदाहरण ( tfds.as_dataframe ):
एमएलक्यूए/vi
विन्यास विवरण : MLQA 'vi' देव और परीक्षण विभाजन।
डेटासेट का आकार :
8.77 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 5,495 |
'validation' | 511 |
- उदाहरण ( tfds.as_dataframe ):
mlqa/zh
कॉन्फ़िगरेशन विवरण : एमएलक्यूए 'जेएच' देव और परीक्षण विभाजन।
डेटासेट का आकार :
5.13 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 5,137 |
'validation' | 504 |
- उदाहरण ( tfds.as_dataframe ):