bot_adversarial_dialogue

説明:

ボット敵対対話データセット。

ボット敵対対話タスクからの攻撃性のラベルが付けられた対話データセット。対話は、人間にボットに敵対的に話しかけるよう依頼して収集されました。

詳細については論文をご覧ください。

ホームページ: https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
ソースコード: tfds.datasets.bot_adversarial_dialogue.Builder
バージョン:
- 1.0.0 (デフォルト): 初期リリース。
自動キャッシュ(ドキュメント): はい
監視キー( as_supervised docを参照): None
図( tfds.show_examples ): サポートされていません。
引用：

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (デフォルト設定)

構成の説明: トレーニング、検証、テストの分割に分割されたダイアログデータセット。
ダウンロードサイズ: 3.06 MiB
データセットのサイズ: 23.38 MiB
分割:

スプリット	例
`'test'`	2,598
`'train'`	69,274
`'valid'`	7,002

機能の構造:

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ	説明
	特徴辞書
ボットペルソナ	シーケンス(テキスト)	（なし、）	弦	ボットによって偽装されたペルソナ。
ダイアログID	テンソル		float32
エピソード_完了	テンソル		ブール
ID	文章		弦	サンプルのID。
ラベル	クラスラベル		int64
ラウンドID	テンソル		float32
スピーカーから評価へ	文章		弦	ラベルが付けられた発話の話者。
文章	文章		弦	分類する発話。

例( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

構成の説明: 攻撃性についてクラウドソーシングの作業者によって評価される人間の安全性評価セット。
ダウンロードサイズ: 10.57 KiB
データセットのサイズ: 34.55 KiB
分割:

スプリット	例
`'test'`	180

機能の構造:

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

機能ドキュメント:

特徴	クラス	Dタイプ	説明
	特徴辞書
エピソード_完了	テンソル	ブール
ID	文章	弦	サンプルのID。
ラベル	クラスラベル	int64
文章	文章	弦	分類する発話。

例( tfds.as_dataframe ):

bot_adversarial_dialogue コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

ボット敵対対話データセット。

bot_adversarial_dialogue/dialogue_datasets (デフォルト設定)

bot_adversarial_dialogue/human_nonadv_safety_eval

bot_adversarial_dialogue