- विवरण :
स्कीमा-गाइडेड डायलॉग (SGD) डेटासेट में एक मानव और एक आभासी सहायक के बीच 20k से अधिक एनोटेट बहु-डोमेन, कार्य-उन्मुख वार्तालाप शामिल हैं। इन वार्तालापों में बैंकों और घटनाओं से लेकर मीडिया, कैलेंडर, यात्रा और मौसम तक 20 डोमेन में फैली सेवाओं और एपीआई के साथ बातचीत शामिल है। इनमें से अधिकांश डोमेन के लिए, डेटासेट में कई अलग-अलग एपीआई होते हैं, जिनमें से कई में अतिव्यापी कार्यप्रणाली होती है, लेकिन अलग-अलग इंटरफेस होते हैं, जो सामान्य वास्तविक दुनिया के परिदृश्यों को दर्शाता है। बड़े पैमाने पर आभासी सहायकों में अन्य कार्यों के बीच उपलब्ध एनोटेशन की विस्तृत श्रृंखला का उपयोग इरादे की भविष्यवाणी, स्लॉट भरने, संवाद स्थिति ट्रैकिंग, नीति अनुकरण सीखने, भाषा निर्माण, उपयोगकर्ता सिमुलेशन सीखने के लिए किया जा सकता है। इनके अलावा, डेटासेट में शून्य-शॉट या कुछ शॉट सेटिंग्स में प्रदर्शन को मापने के लिए मूल्यांकन सेट में अनदेखा डोमेन और सेवाएं हैं।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
स्रोत कोड :
tfds.datasets.schema_guided_dialogue.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
35.12 MiBडेटासेट का आकार :
25.36 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- फ़ीचर संरचना :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| first_speaker | क्लासलेबल | int64 | ||
| मेटाडाटा | विशेषताएं डिक्ट | |||
| मेटाडेटा/सेवाएं | क्रम | |||
| मेटाडेटा/सेवाएं/नाम | टेन्सर | डोरी | ||
| उच्चारणों | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}