- 説明:
Enron Corporation の従業員の電子メール メッセージのコレクション。
次の 2 つの機能があります。
- email_body: メール本文。
subject_line: メールの件名テキスト。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.aeslc.Builder
バージョン:
-
1.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
11.10 MiB
データセットのサイズ:
14.96 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 1,906 |
'train' | 14,436 |
'validation' | 1,960 |
- 機能構造:
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
メール本文 | 文章 | ストリング | ||
件名 | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('email_body', 'subject_line')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}