samsum

  • opis :

SAMSum Corpus zawiera ponad 16 000 dialogów na czacie z ręcznie opatrzonymi komentarzami.

Istnieją dwie funkcje:

Podział Przykłady
'test' 819
'train' 14732
'validation' 818
  • Struktura funkcji :
FeaturesDict({
   
'dialogue': Text(shape=(), dtype=string),
   
'id': Text(shape=(), dtype=string),
   
'summary': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
dialog Tekst strunowy
ID Tekst strunowy
Podsumowanie Tekst strunowy
  • Cytat :
@article{gliwa2019samsum,
  title
={SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization},
  author
={Gliwa, Bogdan and Mochol, Iwona and Biesek, Maciej and Wawer, Aleksander},
  journal
={arXiv preprint arXiv:1911.12237},
  year
={2019}
}