squad_question_generation

  • Descriptif :

Génération de questions à l'aide d'un ensemble de données d'escouade à l'aide de fractionnements de données décrits dans «Neural Question Generation from Text: A Preliminary Study» (Zhou et al, 2017) et «Learning to Ask: Neural Question Generation for Reading Comprehension» (Du et al, 2017).

@inproceedings{du-etal-2017-learning,
    title
= "Learning to Ask: Neural Question Generation for Reading Comprehension",
    author
= "Du, Xinya  and Shao, Junru  and Cardie, Claire",
    booktitle
= "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month
= jul,
    year
= "2017",
    address
= "Vancouver, Canada",
    publisher
= "Association for Computational Linguistics",
    url
= "https://aclanthology.org/P17-1123",
    doi
= "10.18653/v1/P17-1123",
    pages
= "1342--1352",
}

@inproceedings{rajpurkar-etal-2016-squad,
    title
= "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author
= "Rajpurkar, Pranav  and Zhang, Jian  and Lopyrev, Konstantin  and Liang, Percy",
    booktitle
= "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month
= nov,
    year
= "2016",
    address
= "Austin, Texas",
    publisher
= "Association for Computational Linguistics",
    url
= "https://aclanthology.org/D16-1264",
    doi
= "10.18653/v1/D16-1264",
    pages
= "2383--2392",
}

squad_question_generation/split_du (configuration par défaut)

  • Description de la configuration : réponse à la génération de questions indépendantes à partir de contextes de niveau passage (Du et al, 2017).

  • Taille du téléchargement : 62.83 MiB

  • Taille du jeu de données : 84.67 MiB

  • Fractionnements :

Diviser Exemples
'test' 11 877
'train' 75 722
'validation' 10 570
  • Structure des fonctionnalités :
FeaturesDict({
   
'answer': Text(shape=(), dtype=string),
   
'context_passage': Text(shape=(), dtype=string),
   
'question': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
réponse Texte chaîne de caractères
contexte_passage Texte chaîne de caractères
question Texte chaîne de caractères

squad_question_generation/split_zhou

  • Description de la configuration : génération de questions dépendantes de la réponse à partir de contextes de niveau phrase et passage (Zhou et al, 2017).

  • Taille du téléchargement : 62.52 MiB

  • Taille du jeu de données : 111.02 MiB

  • Fractionnements :

Diviser Exemples
'test' 8 964
'train' 86 635
'validation' 8 965
  • Structure des fonctionnalités :
FeaturesDict({
   
'answer': Text(shape=(), dtype=string),
   
'context_passage': Text(shape=(), dtype=string),
   
'context_sentence': Text(shape=(), dtype=string),
   
'question': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
réponse Texte chaîne de caractères
contexte_passage Texte chaîne de caractères
contexte_phrase Texte chaîne de caractères
question Texte chaîne de caractères