skema_panduan_dialog

  • Deskripsi :

Dataset Schema-Guided Dialogue (SGD) terdiri dari lebih dari 20 ribu multidomain beranotasi, percakapan berorientasi tugas antara manusia dan asisten virtual. Percakapan ini melibatkan interaksi dengan layanan dan API yang mencakup 20 domain, mulai dari bank dan acara hingga media, kalender, perjalanan, dan cuaca. Untuk sebagian besar domain ini, kumpulan data berisi beberapa API berbeda, banyak di antaranya memiliki fungsi yang tumpang tindih tetapi antarmuka berbeda, yang mencerminkan skenario dunia nyata yang umum. Beragam anotasi yang tersedia dapat digunakan untuk prediksi maksud, pengisian slot, pelacakan status dialog, pembelajaran peniruan kebijakan, pembuatan bahasa, pembelajaran simulasi pengguna, di antara tugas-tugas lain dalam asisten virtual berskala besar. Selain itu, dataset memiliki domain dan layanan yang tidak terlihat di set evaluasi untuk mengukur kinerja dalam pengaturan zero-shot atau beberapa shot.

Membelah Contoh
'dev' 2.482
'test' 4.201
'train' 16.142
  • Struktur fitur :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
pembicara_pertama LabelKelas int64
metadata fiturDict
metadata/layanan Urutan
metadata/layanan/nama Tensor rangkaian
ucapan Urutan (Teks) (Tidak ada,) rangkaian
  • Kutipan :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}