- opis :
Zbiór wiadomości e-mail pracowników Enron Corporation.
Istnieją dwie funkcje:
- email_body: treść wiadomości e-mail.
topic_line: tekst tematu e-maila.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/ryanzhumich/AESLC
Kod źródłowy :
tfds.datasets.aeslc.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
11.10 MiB
Rozmiar zestawu danych :
14.96 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 1906 |
'train' | 14436 |
'validation' | 1960 |
- Struktura funkcji :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
email_body | Tekst | strunowy | ||
wiersz tematu | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('email_body', 'subject_line')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}