opinion_abstracts

Descriptif :

Il existe deux sous-ensembles de données :

(1) RottenTomatoes : les critiques de films et le consensus extraits de http://rottentomatoes.com/ Il contient les champs "_movie_name", "_movie_id", "_critics" et "_critic_consensus".

(2) IDebate : les arguments extraits de http://idebate.org/ Il a des champs de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Voir aussi https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

Page d'accueil : https://web.eecs.umich.edu/~wangluxy/data.html
Code source : tfds.datasets.opinion_abstracts.Builder
Versions :
- 1.0.0 (par défaut) : aucune note de version.
Taille du téléchargement : 20.08 MiB
Mise en cache automatique ( documentation ): Oui
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

opinion_abstracts/rotten_tomatoes (configuration par défaut)

Description de la configuration : Critiques professionnelles et consensus de 3 731 films.
Taille du jeu de données : 50.10 MiB
Fractionnements :

Diviser	Exemples
`'train'`	3 731

Structure des fonctionnalités :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Dtype
	FonctionnalitésDict
_critique_consensus	Tenseur	chaîne
_critiques	Séquence
_critiques/clé	Tenseur	chaîne
_critiques/valeur	Tenseur	chaîne
_movie_id	Tenseur	chaîne
_nom_du_film	Tenseur	chaîne

Clés supervisées (Voir as_supervised doc ): ('_critics', '_critic_consensus')
Exemples ( tfds.as_dataframe ):

opinion_abstracts/idebate

Description de la configuration : 2 259 réclamations pour 676 débats.
Taille du jeu de données : 3.15 MiB
Fractionnements :

Diviser	Exemples
`'train'`	2 259

Structure des fonctionnalités :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Dtype
	FonctionnalitésDict
_argument_phrases	Séquence
_argument_phrases/clé	Tenseur	chaîne
_argument_phrases/valeur	Tenseur	chaîne
_réclamation	Tenseur	chaîne
_claim_id	Tenseur	chaîne
_debate_name	Tenseur	chaîne

Clés supervisées (Voir as_supervised doc ): ('_argument_sentences', '_claim')
Exemples ( tfds.as_dataframe ):

opinion_abstracts Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

opinion_abstracts/rotten_tomatoes (configuration par défaut)

opinion_abstracts/idebate

opinion_abstracts