- توضیحات :
XNLI زیرمجموعه ای از چند هزار نمونه از MNLI است که به 14 زبان مختلف ترجمه شده است (برخی از منابع کم). همانند MNLI، هدف پیشبینی دلالت متنی است (آیا جمله A دلالت دارد/تضاد/هیچ جمله B را ندارد) و یک کار طبقهبندی است (با توجه به دو جمله، یکی از سه برچسب را پیشبینی کنید).
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.nyu.edu/projects/bowman/xnli/
کد منبع :
tfds.text.Xnli
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
17.04 MiB
حجم مجموعه داده :
29.62 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 5010 |
'validation' | 2,490 |
- ساختار ویژگی :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
فرضیه | TranslationVariableLanguages | |||
فرضیه/زبان | متن | رشته | ||
فرضیه/ترجمه | متن | رشته | ||
برچسب | ClassLabel | int64 | ||
فرضیه | ترجمه | |||
مقدمه/ar | متن | رشته | ||
مقدمه/bg | متن | رشته | ||
مقدمه/د | متن | رشته | ||
مقدمه/ال | متن | رشته | ||
premise/en | متن | رشته | ||
پیش فرض/ها | متن | رشته | ||
premise/fr | متن | رشته | ||
مقدمه/سلام | متن | رشته | ||
premise/ru | متن | رشته | ||
پیش فرض/سو | متن | رشته | ||
مقدمه/ام | متن | رشته | ||
premise/tr | متن | رشته | ||
premise/ur | متن | رشته | ||
premise/vi | متن | رشته | ||
مقدمه/zh | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}
، - توضیحات :
XNLI زیرمجموعه ای از چند هزار نمونه از MNLI است که به 14 زبان مختلف ترجمه شده است (برخی از منابع کم). همانند MNLI، هدف پیشبینی دلالت متنی است (آیا جمله A دلالت دارد/تضاد/هیچ جمله B را ندارد) و یک کار طبقهبندی است (با توجه به دو جمله، یکی از سه برچسب را پیشبینی کنید).
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.nyu.edu/projects/bowman/xnli/
کد منبع :
tfds.text.Xnli
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
17.04 MiB
حجم مجموعه داده :
29.62 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 5010 |
'validation' | 2,490 |
- ساختار ویژگی :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
فرضیه | TranslationVariableLanguages | |||
فرضیه/زبان | متن | رشته | ||
فرضیه/ترجمه | متن | رشته | ||
برچسب | ClassLabel | int64 | ||
فرضیه | ترجمه | |||
مقدمه/ar | متن | رشته | ||
مقدمه/bg | متن | رشته | ||
مقدمه/د | متن | رشته | ||
مقدمه/ال | متن | رشته | ||
premise/en | متن | رشته | ||
پیش فرض/ها | متن | رشته | ||
premise/fr | متن | رشته | ||
مقدمه/سلام | متن | رشته | ||
premise/ru | متن | رشته | ||
پیش فرض/سو | متن | رشته | ||
مقدمه/ام | متن | رشته | ||
premise/tr | متن | رشته | ||
premise/ur | متن | رشته | ||
premise/vi | متن | رشته | ||
مقدمه/zh | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}