- توضیحات :
مجموعه داده های گفتگوی متخاصم ربات.
مجموعه دادههای گفتگو با برچسب توهینآمیز از کار Bot Adversarial Dialogue. دیالوگ ها با درخواست از انسان ها برای گفتگو با ربات ها جمع آوری شد.
جزئیات بیشتر در مقاله
صفحه اصلی : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
ذخیره خودکار ( اسناد ): بله
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (پیکربندی پیشفرض)
توضیحات پیکربندی : مجموعه دادههای گفتگو، به تقسیمبندی قطار، اعتبارسنجی و آزمایش تقسیم میشوند.
حجم دانلود :
3.06 MiB
حجم مجموعه داده :
23.38 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2598 |
'train' | 69274 |
'valid' | 7002 |
- ساختار ویژگی :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
bot_persona | دنباله (متن) | (هیچ یک،) | رشته | شخصیتی که ربات جعل کرده است. |
dialogue_id | تانسور | float32 | ||
قسمت_انجام شد | تانسور | بوول | ||
شناسه | متن | رشته | شناسه نمونه | |
برچسب ها | ClassLabel | int64 | ||
round_id | تانسور | float32 | ||
speaker_to_eval | متن | رشته | گوینده گفته های برچسب زده شده است. | |
متن | متن | رشته | گفته برای طبقه بندی. |
- مثالها ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
شرح پیکربندی : مجموعه ارزیابی ایمنی انسانی که توسط کارگران جمعسپاری برای توهینآمیز بودن ارزیابی میشود.
حجم دانلود :
10.57 KiB
حجم مجموعه داده :
34.55 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 180 |
- ساختار ویژگی :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
قسمت_انجام شد | تانسور | بوول | ||
شناسه | متن | رشته | شناسه نمونه | |
برچسب ها | ClassLabel | int64 | ||
متن | متن | رشته | گفته برای طبقه بندی. |
- مثالها ( tfds.as_dataframe ):