- opis :
Zbiór wiadomości e-mail pracowników Enron Corporation.
Istnieją dwie funkcje:
- email_body: treść wiadomości e-mail.
topic_line: tekst tematu e-maila.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/ryanzhumich/AESLC
Kod źródłowy :
tfds.datasets.aeslc.BuilderWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
11.10 MiBRozmiar zestawu danych :
14.96 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 1906 |
'train' | 14436 |
'validation' | 1960 |
- Struktura funkcji :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| email_body | Tekst | strunowy | ||
| wiersz tematu | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised):('email_body', 'subject_line')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}