- توضیحات :
این مجموعه داده شامل ترجمه ماشینی MNLI به هر یک از زبان های XNLI است. داده های ترجمه توسط XTREME ارائه شده است. توجه داشته باشید که این با داده های ترجمه شده ماشینی ارائه شده توسط کاغذ اصلی XNLI متفاوت است.
صفحه اصلی : https://www.nyu.edu/projects/bowman/xnli/
کد منبع :
tfds.text.xtreme_xnli.XtremeXnli
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
2.31 GiB
حجم مجموعه داده :
1.59 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 392,570 |
- ساختار ویژگی :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
فرضیه | TranslationVariableLanguages | |||
فرضیه/زبان | متن | رشته | ||
فرضیه/ترجمه | متن | رشته | ||
برچسب | ClassLabel | int64 | ||
فرضیه | ترجمه | |||
مقدمه/ar | متن | رشته | ||
مقدمه/bg | متن | رشته | ||
مقدمه/د | متن | رشته | ||
مقدمه/ال | متن | رشته | ||
premise/en | متن | رشته | ||
پیش فرض/ها | متن | رشته | ||
premise/fr | متن | رشته | ||
مقدمه/سلام | متن | رشته | ||
premise/ru | متن | رشته | ||
پیش فرض/سو | متن | رشته | ||
مقدمه/ام | متن | رشته | ||
premise/tr | متن | رشته | ||
premise/ur | متن | رشته | ||
premise/vi | متن | رشته | ||
مقدمه/zh | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}