- opis :
Multi-News, składa się z artykułów z wiadomościami i napisanych przez ludzi streszczeń tych artykułów z serwisu newser.com. Każde podsumowanie jest profesjonalnie napisane przez redaktorów i zawiera linki do oryginalnych cytowanych artykułów.
Istnieją dwie funkcje: - dokument: tekst artykułów oddzielonych specjalnym tokenem "|||||". - podsumowanie: podsumowanie wiadomości.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/Alex-Fabbri/Multi-News
Kod źródłowy :
tfds.summarization.MultiNews
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
245.06 MiB
Rozmiar zestawu danych :
669.80 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 5622 |
'train' | 44 972 |
'validation' | 5622 |
- Struktura funkcji :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
dokument | Tekst | strunowy | ||
streszczenie | Tekst | strunowy |
Klucze nadzorowane (Patrz
as_supervised
doc ):('document', 'summary')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}