- Descriptif :
QASC est un ensemble de données de questions-réponses axé sur la composition des phrases. Il se compose de 9 980 questions à choix multiples à 8 questions sur les sciences à l'école primaire (8 134 train, 926 dev, 920 test) et est livré avec un corpus de 17 millions de phrases.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://allenai.org/data/qasc
Code source :
tfds.datasets.qasc.BuilderVersions :
-
0.1.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.54 MiBTaille du jeu de données :
6.61 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 920 |
'train' | 8 134 |
'validation' | 926 |
- Structure des fonctionnalités :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Caractéristique | Classe | Façonner | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| answerKey | Texte | chaîne de caractères | ||
| les choix | Séquence | |||
| choix/étiquette | Texte | chaîne de caractères | ||
| choix/texte | Texte | chaîne de caractères | ||
| fait combiné | Texte | chaîne de caractères | ||
| fait1 | Texte | chaîne de caractères | ||
| fait2 | Texte | chaîne de caractères | ||
| question_formatée | Texte | chaîne de caractères | ||
| identifiant | Texte | chaîne de caractères | ||
| question | Texte | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}