- Descrição :
Existem dois subconjuntos de dados:
(1) RottenTomatoes: Os críticos de cinema e consenso rastreados de http://rottentomatoes.com/ Tem campos de "_movie_name", "_movie_id", "_critics" e "_critic_consensus".
(2) IDebate: Os argumentos rastreados de http://idebate.org/ Tem campos de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Veja também https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Página inicial : https://web.eecs.umich.edu/~wangluxy/data.html
Código-fonte :
tfds.datasets.opinion_abstracts.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
20.08 MiB
Cache automático ( documentação ): Sim
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
parecer_abstracts/rotten_tomatoes (configuração padrão)
Descrição da configuração : Crítica profissional e consenso de 3.731 filmes.
Tamanho do conjunto de dados :
50.10 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 3.731 |
- Estrutura de recursos :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Documentação do recurso :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
_critic_consensus | tensor | corda | ||
_críticas | Seqüência | |||
_críticas/chave | tensor | corda | ||
_críticas/valor | tensor | corda | ||
_movie_id | tensor | corda | ||
_movie_name | tensor | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('_critics', '_critic_consensus')
Exemplos ( tfds.as_dataframe ):
resumos_opinião/idebate
Descrição da configuração : 2.259 reivindicações para 676 debates.
Tamanho do conjunto de dados :
3.15 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.259 |
- Estrutura de recursos :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Documentação do recurso :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
_argumento_frases | Seqüência | |||
_argumento_frases/chave | tensor | corda | ||
_argumento_frases/valor | tensor | corda | ||
_alegar | tensor | corda | ||
_claim_id | tensor | corda | ||
_debate_name | tensor | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('_argument_sentences', '_claim')
Exemplos ( tfds.as_dataframe ):