- Descrição :
O Opinosis Opinion Dataset consiste em sentenças extraídas de revisões para 51 tópicos. Tópicos e opiniões são obtidos no Tripadvisor, Edmunds.com e Amazon.com.
Documentação Adicional : Explore em Papers With Code
Página inicial : http://kavita-ganesan.com/opinosis/
Código -fonte:
tfds.datasets.opinosis.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
739.65 KiB
Tamanho do conjunto de dados :
725.45 KiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'train' | 51 |
- Estrutura de recursos :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
comentários_enviados | Texto | corda | ||
resumos | Sequência (Texto) | (Nenhum,) | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('review_sents', 'summaries')
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}