의견_추상

  • 설명 :

두 개의 하위 데이터 세트가 있습니다.

(1) RottenTomatoes: http://rottentomatoes.com/ 에서 크롤링한 영화 평론가 및 컨센서스 "_movie_name", "_movie_id", "_critics" 및 "_critic_consensus" 필드가 있습니다.

(2) IDebate: http://idebate.org/ 에서 크롤링된 인수 "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences" 필드가 있습니다.

https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt 도 참조하세요.

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

comment_abstracts/rotten_tomatoes(기본 구성)

  • 구성 설명 : 전문 평론가와 3,731편의 영화에 대한 합의.

  • 데이터 세트 크기 : 50.10 MiB

  • 분할 :

나뉘다
'train' 3,731
  • 기능 구조 :
FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
_비평_합의 텐서
_비평가 순서
_비평가/키 텐서
_비평/가치 텐서
_movie_id 텐서
_영화_이름 텐서

오피니언_초록/아이디베이트

  • 구성 설명 : 676 토론에 대한 2,259 주장.

  • 데이터 세트 크기 : 3.15 MiB

  • 분할 :

나뉘다
'train' 2,259
  • 기능 구조 :
FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
_argument_sentences 순서
_argument_sentences/키 텐서
_argument_sentences/값 텐서
_주장하다 텐서
_claim_id 텐서
_debate_name 텐서