- توضیحات :
این مجموعه داده شامل ترجمه ماشینی داده های آموزشی PAWS انگلیسی است. ترجمه ها توسط معیار XTREME ارائه شده اند و زبان های زیر را پوشش می دهند:
- فرانسوی
- اسپانیایی
- آلمانی
- چینی ها
- ژاپنی
- کره ای
برای جزئیات بیشتر در مورد PAWS، به مقالات مراجعه کنید: PAWS: Paraphrase Adversaries from Word Scrambling در https://arxiv.org/abs/1904.01130 و PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification در https://arxiv. org/abs/1908.11828
برای جزئیات مربوط به XTREME، لطفاً به: XTREME: معیار چند کاره چند زبانه برای ارزیابی تعمیم بین زبانی در https://arxiv.org/abs/2003.11080 مراجعه کنید .
صفحه اصلی : https://github.com/google-research/xtreme
کد منبع :
tfds.text.xtreme_pawsx.XtremePawsx
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
برچسب | ClassLabel | int64 | ||
جمله 1 | متن | رشته | ||
جمله 2 | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (پیکربندی پیشفرض)
توضیحات پیکربندی : به de ترجمه شده است
حجم دانلود :
22.34 MiB
حجم مجموعه داده :
14.19 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49,340 |
- مثالها ( tfds.as_dataframe ):
xtreme_pawsx/es
توضیحات پیکربندی : به es ترجمه شده است
حجم دانلود :
22.27 MiB
حجم مجموعه داده :
14.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49,244 |
- مثالها ( tfds.as_dataframe ):
xtreme_pawsx/fr
توضیحات پیکربندی : ترجمه شده به fr
حجم دانلود :
22.70 MiB
حجم مجموعه داده :
14.53 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49,208 |
- مثالها ( tfds.as_dataframe ):
xtreme_pawsx/ja
توضیحات پیکربندی : به ja ترجمه شده است
حجم دانلود :
25.12 MiB
حجم مجموعه داده :
16.98 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49,086 |
- مثالها ( tfds.as_dataframe ):
xtreme_pawsx/ko
توضیحات پیکربندی : به ko ترجمه شده است
حجم دانلود :
22.99 MiB
حجم مجموعه داده :
14.86 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49298 |
- مثالها ( tfds.as_dataframe ):
xtreme_pawsx/zh
توضیحات پیکربندی : به zh ترجمه شده است
حجم دانلود :
21.45 MiB
حجم مجموعه داده :
13.21 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 49,149 |
- مثالها ( tfds.as_dataframe ):