- Descrizione :
Esistono due sottoset di dati:
(1) RottenTomatoes: i critici cinematografici e il consenso sono stati scansionati da http://rottentomatoes.com/ Ha campi di "_movie_name", "_movie_id", "_critics" e "_critic_consensus".
(2) IDebate: gli argomenti scansionati da http://idebate.org/ Ha campi di "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Vedi anche https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Pagina iniziale : https://web.eecs.umich.edu/~wangluxy/data.html
Codice sorgente :
tfds.datasets.opinion_abstracts.BuilderVersioni :
-
1.0.0(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
20.08 MiBAuto-cache ( documentazione ): Sì
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opinion_abstracts/rotten_tomatoes (configurazione predefinita)
Descrizione della configurazione : critici professionisti e consenso di 3.731 film.
Dimensione del set di dati :
50.10 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'train' | 3.731 |
- Struttura delle caratteristiche :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| _critic_consensus | Tensore | corda | ||
| _critici | Sequenza | |||
| _critici/chiave | Tensore | corda | ||
| _critica/valore | Tensore | corda | ||
| _film_id | Tensore | corda | ||
| _nome_film | Tensore | corda |
Chiavi supervisionate (vedi
as_superviseddoc ):('_critics', '_critic_consensus')Esempi ( tfds.as_dataframe ):
opinion_abstracts/idebate
Descrizione della configurazione : 2.259 reclami per 676 dibattiti.
Dimensione del set di dati :
3.15 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'train' | 2.259 |
- Struttura delle caratteristiche :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| _argomento_frasi | Sequenza | |||
| _argomento_frasi/chiave | Tensore | corda | ||
| _argomento_frasi/valore | Tensore | corda | ||
| _reclamo | Tensore | corda | ||
| _claim_id | Tensore | corda | ||
| _nome_dibattito | Tensore | corda |
Chiavi supervisionate (vedi
as_superviseddoc ):('_argument_sentences', '_claim')Esempi ( tfds.as_dataframe ):