- বর্ণনা :
বট প্রতিপক্ষের ডায়লগ ডেটাসেট।
বট অ্যাডভারসারিয়াল ডায়ালগ টাস্ক থেকে আপত্তিকরতার লেবেলযুক্ত ডায়ালগ ডেটাসেট। সংলাপগুলো সংগৃহীত হয়েছিল মানুষকে প্রতিপক্ষভাবে বটদের সাথে কথা বলতে বলে।
কাগজে আরো বিস্তারিত.
হোমপেজ : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : সংলাপ ডেটাসেট, ট্রেনে বিভক্ত, বৈধতা এবং পরীক্ষা বিভাজন।
ডাউনলোড আকার :
3.06 MiB
ডেটাসেটের আকার :
23.38 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
বট_ব্যক্তিত্ব | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | বট দ্বারা ছদ্মবেশিত ব্যক্তিত্ব। |
dialogue_id | টেনসর | float32 | ||
episode_done | টেনসর | bool | ||
আইডি | পাঠ্য | স্ট্রিং | নমুনার আইডি। | |
লেবেল | ক্লাসলেবেল | int64 | ||
রাউন্ড_আইডি | টেনসর | float32 | ||
স্পিকার_থেকে_ইভাল | পাঠ্য | স্ট্রিং | লেবেলযুক্ত উচ্চারণগুলির স্পিকার। | |
পাঠ্য | পাঠ্য | স্ট্রিং | শ্রেণীবদ্ধ করার উচ্চারণ। |
- উদাহরণ ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
কনফিগারেশনের বিবরণ : আপত্তিকরতার জন্য ক্রাউডসোর্সড কর্মীদের দ্বারা মূল্যায়ন করা একটি মানব নিরাপত্তা মূল্যায়ন সেট।
ডাউনলোড সাইজ :
10.57 KiB
ডেটাসেটের আকার :
34.55 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 180 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_done | টেনসর | bool | ||
আইডি | পাঠ্য | স্ট্রিং | নমুনার আইডি। | |
লেবেল | ক্লাসলেবেল | int64 | ||
পাঠ্য | পাঠ্য | স্ট্রিং | শ্রেণীবদ্ধ করার উচ্চারণ। |
- উদাহরণ ( tfds.as_dataframe ):