- תיאור :
סט נתונים של דיאלוג יריב של בוט.
מערכי נתונים של דיאלוג עם התווית פוגענית ממשימת Bot Adversarial Dialogue. הדיאלוגים נאספו על ידי בקשה מבני אדם לדבר יריב עם בוטים.
פרטים נוספים בעיתון .
דף הבית : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
שמור אוטומטי במטמון ( תיעוד ): כן
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (תצורת ברירת המחדל)
תיאור תצורה : מערכי הנתונים של הדיאלוגים, מחולקים בפיצולי רכבת, אימות ובדיקה.
גודל הורדה :
3.06 MiB
גודל ערכת נתונים :
23.38 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- מבנה תכונה :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
bot_persona | רצף (טקסט) | (אף אחד,) | חוּט | הדמות המתחזה על ידי הבוט. |
dialogue_id | מוֹתֵחַ | לצוף32 | ||
episode_done | מוֹתֵחַ | bool | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | המזהה של המדגם. | |
תוויות | ClassLabel | int64 | ||
round_id | מוֹתֵחַ | לצוף32 | ||
רמקול_לערך | טֶקסט | חוּט | דובר ההתבטאויות מתויג. | |
טֶקסט | טֶקסט | חוּט | האמירה לסווג. |
- דוגמאות ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
תיאור תצורה : ערכת הערכת בטיחות אנושית שהוערכה על ידי עובדים במיקור המונים על פגיעה.
גודל הורדה :
10.57 KiB
גודל מערך נתונים :
34.55 KiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 180 |
- מבנה תכונה :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
episode_done | מוֹתֵחַ | bool | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | המזהה של המדגם. | |
תוויות | ClassLabel | int64 | ||
טֶקסט | טֶקסט | חוּט | האמירה לסווג. |
- דוגמאות ( tfds.as_dataframe ):