opinião_resumos

  • Descrição :

Existem dois subconjuntos de dados:

(1) RottenTomatoes: Os críticos de cinema e consenso rastreados de http://rottentomatoes.com/ Tem campos de "_movie_name", "_movie_id", "_critics" e "_critic_consensus".

(2) IDebate: Os argumentos rastreados de http://idebate.org/ Tem campos de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Veja também https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

parecer_abstracts/rotten_tomatoes (configuração padrão)

  • Descrição da configuração : Crítica profissional e consenso de 3.731 filmes.

  • Tamanho do conjunto de dados : 50.10 MiB

  • Divisões :

Dividir Exemplos
'train' 3.731
  • Estrutura de recursos :
FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})
  • Documentação do recurso :
Recurso Aula Forma Tipo D Descrição
RecursosDict
_critic_consensus tensor corda
_críticas Seqüência
_críticas/chave tensor corda
_críticas/valor tensor corda
_movie_id tensor corda
_movie_name tensor corda

resumos_opinião/idebate

  • Descrição da configuração : 2.259 reivindicações para 676 debates.

  • Tamanho do conjunto de dados : 3.15 MiB

  • Divisões :

Dividir Exemplos
'train' 2.259
  • Estrutura de recursos :
FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})
  • Documentação do recurso :
Recurso Aula Forma Tipo D Descrição
RecursosDict
_argumento_frases Seqüência
_argumento_frases/chave tensor corda
_argumento_frases/valor tensor corda
_alegar tensor corda
_claim_id tensor corda
_debate_name tensor corda