xtreme_pawsx

  • תיאור :

מערך נתונים זה מכיל תרגומי מכונה של נתוני ההדרכה של PAWS באנגלית. התרגומים מסופקים על ידי מדד XTREME ומכסים את השפות הבאות:

  • צָרְפָתִית
  • ספרדית
  • גֶרמָנִיָת
  • סִינִית
  • יַפָּנִית
  • קוריאנית

לפרטים נוספים על PAWS, ראה את המסמכים: PAWS: Paraphrase Adversaries from Word Scrambling בכתובת https://arxiv.org/abs/1904.01130 ו-PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification בכתובת https://arxiv. org/abs/1908.11828

לפרטים הקשורים ל-XTREME, אנא עיין ב: XTREME: A Massively Multilingual Multi-Task Benchmark for Evaluating Generalization Cross-lingual בכתובת https://arxiv.org/abs/2003.11080

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=string),
    'sentence2': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תווית ClassLabel int64
משפט 1 טֶקסט חוּט
משפט 2 טֶקסט חוּט
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}

xtreme_pawsx/de (תצורת ברירת המחדל)

  • תיאור תצורה : תורגם ל-de

  • גודל הורדה : 22.34 MiB

  • גודל מערך נתונים : 14.19 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,340

xtreme_pawsx/es

  • תיאור תצורה : תורגם ל-es

  • גודל הורדה : 22.27 MiB

  • גודל מערך נתונים : 14.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,244

xtreme_pawsx/fr

  • תיאור תצורה : תורגם ל-fr

  • גודל הורדה : 22.70 MiB

  • גודל ערכת נתונים: 14.53 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,208

xtreme_pawsx/ja

  • תיאור תצורה : תורגם ל-ja

  • גודל הורדה : 25.12 MiB

  • גודל ערכת נתונים : 16.98 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,086

xtreme_pawsx/ko

  • תיאור תצורה : תורגם לקו

  • גודל הורדה : 22.99 MiB

  • גודל מערך נתונים : 14.86 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,298

xtreme_pawsx/zh

  • תיאור תצורה : תורגם ל-zh

  • גודל הורדה : 21.45 MiB

  • גודל מערך נתונים : 13.21 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 49,149