- توضیحات :
مجموعه داده گفتگوی هدایتشده طرحواره (SGD) شامل بیش از 20 هزار گفتگوی چند دامنهای مشروح شده و وظیفهمحور بین یک انسان و یک دستیار مجازی است. این مکالمات شامل تعامل با سرویسها و APIهایی است که 20 حوزه را شامل میشود، از بانکها و رویدادها گرفته تا رسانهها، تقویم، سفر و آبوهوا. برای اکثر این دامنه ها، مجموعه داده شامل چندین API مختلف است که بسیاری از آنها دارای عملکردهای همپوشانی هستند اما رابط های متفاوتی دارند که سناریوهای رایج دنیای واقعی را منعکس می کند. طیف گسترده ای از حاشیه نویسی های موجود را می توان برای پیش بینی قصد، پر کردن شکاف، ردیابی وضعیت گفتگو، یادگیری تقلید خط مشی، تولید زبان، یادگیری شبیه سازی کاربر، از جمله کارهای دیگر در دستیاران مجازی در مقیاس بزرگ استفاده کرد. علاوه بر اینها، مجموعه داده دارای حوزهها و سرویسهای دیده نشده در مجموعه ارزیابی برای تعیین کمیت عملکرد در تنظیمات صفر یا چند شات است.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
35.12 MiB
حجم مجموعه داده :
25.36 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- ساختار ویژگی :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
first_speaker | ClassLabel | int64 | ||
فراداده | FeaturesDict | |||
فراداده / خدمات | توالی | |||
فراداده/خدمات/نام | تانسور | رشته | ||
گفته ها | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}