qasc

  • Descriptif :

QASC est un ensemble de données de questions-réponses axé sur la composition des phrases. Il se compose de 9 980 questions à choix multiples à 8 questions sur les sciences à l'école primaire (8 134 train, 926 dev, 920 test) et est livré avec un corpus de 17 millions de phrases.

Diviser Exemples
'test' 920
'train' 8 134
'validation' 926
  • Structure des fonctionnalités :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
answerKey Texte chaîne de caractères
les choix Séquence
choix/étiquette Texte chaîne de caractères
choix/texte Texte chaîne de caractères
fait combiné Texte chaîne de caractères
fait1 Texte chaîne de caractères
fait2 Texte chaîne de caractères
question_formatée Texte chaîne de caractères
identifiant Texte chaîne de caractères
question Texte chaîne de caractères
  • Citation :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}