- توضیحات :
مجموعه ای از پیام های ایمیل کارکنان در شرکت انرون.
دو ویژگی وجود دارد:
- email_body: متن متن ایمیل.
subject_line: متن موضوع ایمیل.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/ryanzhumich/AESLC
کد منبع :
tfds.datasets.aeslc.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
11.10 MiB
حجم مجموعه داده :
14.96 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1906 |
'train' | 14,436 |
'validation' | 1,960 |
- ساختار ویژگی :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
email_body | متن | رشته | ||
نوار عنوان | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('email_body', 'subject_line')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}