- Descriptif :
L'ensemble de données d'opinion d'Opinosis se compose de phrases extraites de critiques pour 51 sujets. Les sujets et opinions proviennent de Tripadvisor, Edmunds.com et Amazon.com.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : http://kavita-ganesan.com/opinosis/
Code source :
tfds.datasets.opinosis.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
739.65 KiB
Taille du jeu de données :
725.45 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 51 |
- Structure des fonctionnalités :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
review_sents | Texte | chaîne de caractères | ||
résumés | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):('review_sents', 'summaries')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}