opinioni_astratti

  • Descrizione :

Esistono due sottoset di dati:

(1) RottenTomatoes: i critici cinematografici e il consenso sono stati scansionati da http://rottentomatoes.com/ Ha campi di "_movie_name", "_movie_id", "_critics" e "_critic_consensus".

(2) IDebate: gli argomenti scansionati da http://idebate.org/ Ha campi di "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Vedi anche https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

@inproceedings{wang-ling-2016-neural,
    title
= "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author
= "Wang, Lu  and
      Ling, Wang"
,
    booktitle
= "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month
= jun,
    year
= "2016",
    address
= "San Diego, California",
    publisher
= "Association for Computational Linguistics",
    url
= "https://www.aclweb.org/anthology/N16-1007",
    doi
= "10.18653/v1/N16-1007",
    pages
= "47--57",
}

opinion_abstracts/rotten_tomatoes (configurazione predefinita)

  • Descrizione della configurazione : critici professionisti e consenso di 3.731 film.

  • Dimensione del set di dati : 50.10 MiB

  • Divisioni :

Diviso Esempi
'train' 3.731
  • Struttura delle caratteristiche :
FeaturesDict({
   
'_critic_consensus': string,
   
'_critics': Sequence({
       
'key': string,
       
'value': string,
   
}),
   
'_movie_id': string,
   
'_movie_name': string,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
_critic_consensus Tensore corda
_critici Sequenza
_critici/chiave Tensore corda
_critica/valore Tensore corda
_film_id Tensore corda
_nome_film Tensore corda

opinion_abstracts/idebate

  • Descrizione della configurazione : 2.259 reclami per 676 dibattiti.

  • Dimensione del set di dati : 3.15 MiB

  • Divisioni :

Diviso Esempi
'train' 2.259
  • Struttura delle caratteristiche :
FeaturesDict({
   
'_argument_sentences': Sequence({
       
'key': string,
       
'value': string,
   
}),
   
'_claim': string,
   
'_claim_id': string,
   
'_debate_name': string,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
_argomento_frasi Sequenza
_argomento_frasi/chiave Tensore corda
_argomento_frasi/valore Tensore corda
_reclamo Tensore corda
_claim_id Tensore corda
_nome_dibattito Tensore corda