삼섬

  • 설명 :

SAMSum Corpus에는 수동으로 주석이 달린 요약이 포함된 16,000개 이상의 채팅 대화가 포함되어 있습니다.

두 가지 기능이 있습니다.

나뉘다
'test' 819
'train' 14,732
'validation' 818
  • 기능 구조 :
FeaturesDict({
    'dialogue': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
대화 텍스트
ID 텍스트
요약 텍스트
  • 인용 :
@article{gliwa2019samsum,
  title={SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization},
  author={Gliwa, Bogdan and Mochol, Iwona and Biesek, Maciej and Wawer, Aleksander},
  journal={arXiv preprint arXiv:1911.12237},
  year={2019}
}