mlqa

  • توضیحات :

MLQA (مجموعه داده پاسخگویی به سوالات چند زبانه) یک مجموعه داده معیار برای ارزیابی عملکرد پاسخگویی به سوالات چند زبانه است. مجموعه داده شامل 7 زبان است: عربی، آلمانی، اسپانیایی، انگلیسی، هندی، ویتنامی، چینی.

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
پاسخ می دهد توالی
answers/answer_start تانسور int32
پاسخ / متن متن رشته
متن نوشته متن رشته
شناسه تانسور رشته
سوال متن رشته
عنوان متن رشته
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (پیکربندی پیش فرض)

  • توضیحات پیکربندی : MLQA 'ar' توسعه دهنده و تقسیم های آزمایشی.

  • حجم مجموعه داده : 9.28 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,335
'validation' 517

mlqa/de

  • توضیحات پیکربندی : MLQA 'de' توسعه دهنده و تقسیمات آزمایشی.

  • حجم مجموعه داده : 5.06 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 4,517
'validation' 512

mlqa/en

  • توضیحات پیکربندی : MLQA 'en' توسعه دهنده و تقسیمات آزمایشی.

  • حجم مجموعه داده : 15.72 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 11590
'validation' 1,148

mlqa/es

  • توضیحات پیکربندی : MLQA 'es' dev و تست تقسیم می شود.

  • حجم مجموعه داده : 5.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,253
'validation' 500

mlqa/سلام

  • توضیحات پیکربندی : MLQA 'hi' توسعه دهنده و تقسیم های آزمایشی.

  • حجم مجموعه داده : 12.83 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 4,918
'validation' 507

mlqa/vi

  • توضیحات پیکربندی : MLQA 'vi' توسعه دهنده و تقسیمات آزمایشی.

  • حجم مجموعه داده : 8.77 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,495
'validation' 511

mlqa/zh

  • شرح پیکربندی : MLQA 'zh' توسعه دهنده و تقسیم های آزمایشی.

  • حجم مجموعه داده : 5.13 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,137
'validation' 504