- Descriptif :
WikiDialog est un vaste ensemble de données de conversations de recherche d'informations générées de manière synthétique. Chaque conversation de l'ensemble de données contient deux locuteurs fondés sur un passage de Wikipédia en anglais : les énoncés d'un locuteur consistent en des phrases exactes du passage ; l'autre locuteur est généré par un grand modèle de langage.
Description de la config : WikiDialog généré à partir du dialog inpainter affiné sur OR-QuAC et QReCC.
OQ
signifie OR-QuAC et QReCC.Page d' accueil : https://github.com/google-research/dialog-inpainting#wikidialog-oq
Code source :
tfds.text.wiki_dialog.WikiDialog
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
7.04 GiB
Taille du jeu de données :
36.58 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 11 264 129 |
'validation' | 113 822 |
- Structure des fonctionnalités :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
num_auteur | Séquence (tenseur) | (Aucun,) | int32 | |
passage | Texte | chaîne de caractères | ||
pid | Texte | chaîne de caractères | ||
Phrases | Séquence (texte) | (Aucun,) | chaîne de caractères | |
Titre | Texte | chaîne de caractères | ||
énoncés | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}