- תיאור :
מערך נתונים זה מכיל תרגומי מכונה של נתוני ההדרכה של PAWS באנגלית. התרגומים מסופקים על ידי מדד XTREME ומכסים את השפות הבאות:
- צָרְפָתִית
- ספרדית
- גֶרמָנִיָת
- סִינִית
- יַפָּנִית
- קוריאנית
לפרטים נוספים על PAWS, ראה את המסמכים: PAWS: Paraphrase Adversaries from Word Scrambling בכתובת https://arxiv.org/abs/1904.01130 ו-PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification בכתובת https://arxiv. org/abs/1908.11828
לפרטים הקשורים ל-XTREME, אנא עיין ב: XTREME: A Massively Multilingual Multi-Task Benchmark for Evaluating Generalization Cross-lingual בכתובת https://arxiv.org/abs/2003.11080
קוד מקור :
tfds.text.xtreme_pawsx.XtremePawsx
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תווית | ClassLabel | int64 | ||
משפט 1 | טֶקסט | חוּט | ||
משפט 2 | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (תצורת ברירת המחדל)
תיאור תצורה : תורגם ל-de
גודל הורדה :
22.34 MiB
גודל מערך נתונים :
14.19 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,340 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/es
תיאור תצורה : תורגם ל-es
גודל הורדה :
22.27 MiB
גודל מערך נתונים :
14.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,244 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/fr
תיאור תצורה : תורגם ל-fr
גודל הורדה :
22.70 MiB
גודל ערכת נתונים:
14.53 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,208 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/ja
תיאור תצורה : תורגם ל-ja
גודל הורדה :
25.12 MiB
גודל ערכת נתונים :
16.98 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,086 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/ko
תיאור תצורה : תורגם לקו
גודל הורדה :
22.99 MiB
גודל מערך נתונים :
14.86 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,298 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/zh
תיאור תצורה : תורגם ל-zh
גודל הורדה :
21.45 MiB
גודל מערך נתונים :
13.21 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,149 |
- דוגמאות ( tfds.as_dataframe ):