squad_question_generation

Descriptif :

Génération de questions à l'aide d'un ensemble de données d'escouade à l'aide de fractionnements de données décrits dans «Neural Question Generation from Text: A Preliminary Study» (Zhou et al, 2017) et «Learning to Ask: Neural Question Generation for Reading Comprehension» (Du et al, 2017).

Page d' accueil : https://github.com/xinyadu/nqg @inproceedings{du-etal-2017-learning, title = "Apprendre à poser : génération de questions neurales pour la compréhension de la lecture", auteur = "Du, Xinya et Shao, Junru et Cardie, Claire", booktitle = "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)", month = jul, year = "2017", address = "Vancouver, Canada", publisher = " Association for Computational Linguistics", url = "https://aclanthology.org/P17-1123", doi = "10.18653/v1/P17-1123", pages = "1342--1352", } ", mois = juil, année = "2017", adresse = "Vancouver, Canada", éditeur = "Association pour la linguistique computationnelle", url = "https://aclanthology.org/P17-1123", doi = "10.18653/v1/P17-1123" , pages = "1342--1352", } )
Code source : tfds.text.squad_question_generation.SquadQuestionGeneration
Versions :
- 1.0.0 : version initiale avec des identifiants SQuAD QAS uniques dans chaque division, en utilisant le contexte de niveau de passage (Zhou et al, 2017).
- 2.0.0 : Correspond à la division originale de (Zhou et al, 2017), autorise les contextes au niveau de la phrase et du passage, et utilise les réponses de (Zhou et al, 2017).
- 3.0.0 (par défaut) : Ajout de la division de (Du et al, 2017) également.
Mise en cache automatique ( documentation ): Oui
Touches supervisées (Voir as_supervised doc ): ('context_passage', 'question')
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@inproceedings{du-etal-2017-learning,
    title = "Learning to Ask: Neural Question Generation for Reading Comprehension",
    author = "Du, Xinya  and Shao, Junru  and Cardie, Claire",
    booktitle = "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = jul,
    year = "2017",
    address = "Vancouver, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/P17-1123",
    doi = "10.18653/v1/P17-1123",
    pages = "1342--1352",
}

@inproceedings{rajpurkar-etal-2016-squad,
    title = "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author = "Rajpurkar, Pranav  and Zhang, Jian  and Lopyrev, Konstantin  and Liang, Percy",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D16-1264",
    doi = "10.18653/v1/D16-1264",
    pages = "2383--2392",
}

squad_question_generation/split_du (configuration par défaut)

Description de la configuration : réponse à la génération de questions indépendantes à partir de contextes de niveau passage (Du et al, 2017).
Taille du téléchargement : 62.83 MiB
Taille du jeu de données : 84.67 MiB
Fractionnements :

Diviser	Exemples
`'test'`	11 877
`'train'`	75 722
`'validation'`	10 570

Structure des fonctionnalités :

FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Dtype
	FonctionnalitésDict
réponse	Texte	chaîne de caractères
contexte_passage	Texte	chaîne de caractères
question	Texte	chaîne de caractères

Exemples ( tfds.as_dataframe ):

squad_question_generation/split_zhou

Description de la configuration : génération de questions dépendantes de la réponse à partir de contextes de niveau phrase et passage (Zhou et al, 2017).
Taille du téléchargement : 62.52 MiB
Taille du jeu de données : 111.02 MiB
Fractionnements :

Diviser	Exemples
`'test'`	8 964
`'train'`	86 635
`'validation'`	8 965

Structure des fonctionnalités :

FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'context_sentence': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Dtype
	FonctionnalitésDict
réponse	Texte	chaîne de caractères
contexte_passage	Texte	chaîne de caractères
contexte_phrase	Texte	chaîne de caractères
question	Texte	chaîne de caractères

Exemples ( tfds.as_dataframe ):