- Descriptif :
Cosmos QA est un ensemble de données à grande échelle de 35 600 problèmes qui nécessitent une compréhension en lecture basée sur le bon sens, formulés sous forme de questions à choix multiples. Il se concentre sur la lecture entre les lignes d'une collection diversifiée de récits quotidiens de personnes, posant des questions concernant les causes ou les effets probables d'événements qui nécessitent un raisonnement au-delà de la portée exacte du texte dans le contexte.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://wilburone.github.io/cosmos/
Code source :
tfds.question_answering.CosmosQA
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
23.27 MiB
Taille du jeu de données :
27.09 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 6 963 |
'train' | 25 262 |
'validation' | 2 985 |
- Structure des fonctionnalités :
FeaturesDict({
'answer0': Text(shape=(), dtype=string),
'answer1': Text(shape=(), dtype=string),
'answer2': Text(shape=(), dtype=string),
'answer3': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=4),
'question': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
réponse0 | Texte | chaîne de caractères | ||
Réponse 1 | Texte | chaîne de caractères | ||
réponse2 | Texte | chaîne de caractères | ||
réponse3 | Texte | chaîne de caractères | ||
le contexte | Texte | chaîne de caractères | ||
identifiant | Texte | chaîne de caractères | ||
étiquette | Étiquette de classe | int64 | ||
question | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}