książka

 • opis :

BookSum: zbiór zbiorów danych do podsumowania narracji w długiej formie

Ta implementacja obsługuje obecnie tylko streszczenia książek i rozdziałów.

GitHub: https://github.com/salesforce/booksum

Folder podręcznika powinien zawierać następujące katalogi:

- `booksum/`
- `all_chapterized_books/`
 • Automatyczne buforowanie ( dokumentacja ): Tak (test, walidacja), Tylko wtedy, gdy shuffle_files=False (pociąg)

 • Struktura funkcji :

FeaturesDict({
  'document': Text(shape=(), dtype=string),
  'summary': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
dokument Tekst strunowy
streszczenie Tekst strunowy
@article{kryscinski2021booksum,
   title={BookSum: A Collection of Datasets for Long-form Narrative Summarization},
   author={Wojciech Kry{\'s}ci{\'n}ski and Nazneen Rajani and Divyansh Agarwal and Caiming Xiong and Dragomir Radev},
   year={2021},
   eprint={2105.08209},
   archivePrefix={arXiv},
   primaryClass={cs.CL}
}

suma książek/książka (domyślna konfiguracja)

 • Opis konfiguracji : podsumowanie na poziomie książki

 • Rozmiar zestawu danych : 208.81 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 46
'train' 312
'validation' 45

księgozbiór/rozdział

 • Opis konfiguracji : podsumowanie na poziomie rozdziału

 • Rozmiar zestawu danych : 216.71 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 1083
'train' 6524
'validation' 891