- Descriptif :
XNLI est un sous-ensemble de quelques milliers d'exemples de MNLI qui a été traduit dans 14 langues différentes (certaines ressources de faible envergure). Comme avec MNLI, l'objectif est de prédire l'implication textuelle (la phrase A implique-t-elle/contredit-elle/aucune la phrase B) et est une tâche de classification (étant donné deux phrases, prédire l'une des trois étiquettes).
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://www.nyu.edu/projects/bowman/xnli/
Code source :
tfds.text.Xnli
Versions :
-
1.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
17.04 MiB
Taille du jeu de données :
29.62 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 010 |
'validation' | 2 490 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
hypothèse | TraductionVariableLanguages | |||
hypothèse/langage | Texte | chaîne de caractères | ||
hypothèse/traduction | Texte | chaîne de caractères | ||
étiquette | Étiquette de classe | int64 | ||
prémisse | Traduction | |||
prémisse / ar | Texte | chaîne de caractères | ||
prémisse/bg | Texte | chaîne de caractères | ||
prémisse/de | Texte | chaîne de caractères | ||
prémisse / el | Texte | chaîne de caractères | ||
prémisse/fr | Texte | chaîne de caractères | ||
prémisse(s) | Texte | chaîne de caractères | ||
prémisse/en | Texte | chaîne de caractères | ||
prémisse/salut | Texte | chaîne de caractères | ||
prémisse/ru | Texte | chaîne de caractères | ||
prémisse/sw | Texte | chaîne de caractères | ||
prémisse/th | Texte | chaîne de caractères | ||
prémisse/tr | Texte | chaîne de caractères | ||
prémisse / votre | Texte | chaîne de caractères | ||
prémisse/vi | Texte | chaîne de caractères | ||
prémisse/zh | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}
, - Descriptif :
XNLI est un sous-ensemble de quelques milliers d'exemples de MNLI qui a été traduit dans 14 langues différentes (certaines ressources de faible envergure). Comme avec MNLI, l'objectif est de prédire l'implication textuelle (la phrase A implique-t-elle/contredit-elle/aucune la phrase B) et est une tâche de classification (étant donné deux phrases, prédire l'une des trois étiquettes).
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://www.nyu.edu/projects/bowman/xnli/
Code source :
tfds.text.Xnli
Versions :
-
1.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
17.04 MiB
Taille du jeu de données :
29.62 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 010 |
'validation' | 2 490 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
hypothèse | TraductionVariableLanguages | |||
hypothèse/langage | Texte | chaîne de caractères | ||
hypothèse/traduction | Texte | chaîne de caractères | ||
étiquette | Étiquette de classe | int64 | ||
prémisse | Traduction | |||
prémisse / ar | Texte | chaîne de caractères | ||
prémisse/bg | Texte | chaîne de caractères | ||
prémisse/de | Texte | chaîne de caractères | ||
prémisse / el | Texte | chaîne de caractères | ||
prémisse/fr | Texte | chaîne de caractères | ||
prémisse(s) | Texte | chaîne de caractères | ||
prémisse/en | Texte | chaîne de caractères | ||
prémisse/salut | Texte | chaîne de caractères | ||
prémisse/ru | Texte | chaîne de caractères | ||
prémisse/sw | Texte | chaîne de caractères | ||
prémisse/th | Texte | chaîne de caractères | ||
prémisse/tr | Texte | chaîne de caractères | ||
prémisse / votre | Texte | chaîne de caractères | ||
prémisse/vi | Texte | chaîne de caractères | ||
prémisse/zh | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}