- Descriptif :
Il existe deux sous-ensembles de données :
(1) RottenTomatoes : les critiques de films et le consensus extraits de http://rottentomatoes.com/ Il contient les champs "_movie_name", "_movie_id", "_critics" et "_critic_consensus".
(2) IDebate : les arguments extraits de http://idebate.org/ Il a des champs de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Voir aussi https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Page d'accueil : https://web.eecs.umich.edu/~wangluxy/data.html
Code source :
tfds.datasets.opinion_abstracts.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
20.08 MiB
Mise en cache automatique ( documentation ): Oui
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opinion_abstracts/rotten_tomatoes (configuration par défaut)
Description de la configuration : Critiques professionnelles et consensus de 3 731 films.
Taille du jeu de données :
50.10 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 3 731 |
- Structure des fonctionnalités :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
_critique_consensus | Tenseur | chaîne | ||
_critiques | Séquence | |||
_critiques/clé | Tenseur | chaîne | ||
_critiques/valeur | Tenseur | chaîne | ||
_movie_id | Tenseur | chaîne | ||
_nom_du_film | Tenseur | chaîne |
Clés supervisées (Voir
as_supervised
doc ):('_critics', '_critic_consensus')
Exemples ( tfds.as_dataframe ):
opinion_abstracts/idebate
Description de la configuration : 2 259 réclamations pour 676 débats.
Taille du jeu de données :
3.15 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 2 259 |
- Structure des fonctionnalités :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
_argument_phrases | Séquence | |||
_argument_phrases/clé | Tenseur | chaîne | ||
_argument_phrases/valeur | Tenseur | chaîne | ||
_réclamation | Tenseur | chaîne | ||
_claim_id | Tenseur | chaîne | ||
_debate_name | Tenseur | chaîne |
Clés supervisées (Voir
as_supervised
doc ):('_argument_sentences', '_claim')
Exemples ( tfds.as_dataframe ):