- Açıklama :
Enron Corporation'daki çalışanların e-posta mesajlarından oluşan bir koleksiyon.
İki özellik vardır:
- email_body: e-posta gövde metni.
konu_satırı: e-posta konu metni.
Ana sayfa : https://github.com/ryanzhumich/AESLC
Kaynak kodu :
tfds.datasets.aeslc.Builder
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
11.10 MiB
Veri kümesi boyutu :
14.96 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.906 |
'train' | 14.436 |
'validation' | 1.960 |
- Özellik yapısı :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
email_body | Metin | sicim | ||
konu satırı | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):('email_body', 'subject_line')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}