xtreme_pawsx

  • توضیحات :

این مجموعه داده شامل ترجمه ماشینی داده های آموزشی PAWS انگلیسی است. ترجمه ها توسط معیار XTREME ارائه شده اند و زبان های زیر را پوشش می دهند:

  • فرانسوی
  • اسپانیایی
  • آلمانی
  • چینی ها
  • ژاپنی
  • کره ای

برای جزئیات بیشتر در مورد PAWS، به مقالات مراجعه کنید: PAWS: Paraphrase Adversaries from Word Scrambling در https://arxiv.org/abs/1904.01130 و PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification در https://arxiv. org/abs/1908.11828

برای جزئیات مربوط به XTREME، لطفاً به: XTREME: معیار چند کاره چند زبانه برای ارزیابی تعمیم بین زبانی در https://arxiv.org/abs/2003.11080 مراجعه کنید .

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=string),
    'sentence2': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
برچسب ClassLabel int64
جمله 1 متن رشته
جمله 2 متن رشته
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}

xtreme_pawsx/de (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : به de ترجمه شده است

  • حجم دانلود : 22.34 MiB

  • حجم مجموعه داده : 14.19 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49,340

xtreme_pawsx/es

  • توضیحات پیکربندی : به es ترجمه شده است

  • حجم دانلود : 22.27 MiB

  • حجم مجموعه داده : 14.09 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49,244

xtreme_pawsx/fr

  • توضیحات پیکربندی : ترجمه شده به fr

  • حجم دانلود : 22.70 MiB

  • حجم مجموعه داده : 14.53 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49,208

xtreme_pawsx/ja

  • توضیحات پیکربندی : به ja ترجمه شده است

  • حجم دانلود : 25.12 MiB

  • حجم مجموعه داده : 16.98 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49,086

xtreme_pawsx/ko

  • توضیحات پیکربندی : به ko ترجمه شده است

  • حجم دانلود : 22.99 MiB

  • حجم مجموعه داده : 14.86 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49298

xtreme_pawsx/zh

  • توضیحات پیکربندی : به zh ترجمه شده است

  • حجم دانلود : 21.45 MiB

  • حجم مجموعه داده : 13.21 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 49,149