- Deskripsi :
Dataset Schema-Guided Dialogue (SGD) terdiri dari lebih dari 20 ribu multidomain beranotasi, percakapan berorientasi tugas antara manusia dan asisten virtual. Percakapan ini melibatkan interaksi dengan layanan dan API yang mencakup 20 domain, mulai dari bank dan acara hingga media, kalender, perjalanan, dan cuaca. Untuk sebagian besar domain ini, kumpulan data berisi beberapa API berbeda, banyak di antaranya memiliki fungsi yang tumpang tindih tetapi antarmuka berbeda, yang mencerminkan skenario dunia nyata yang umum. Beragam anotasi yang tersedia dapat digunakan untuk prediksi maksud, pengisian slot, pelacakan status dialog, pembelajaran peniruan kebijakan, pembuatan bahasa, pembelajaran simulasi pengguna, di antara tugas-tugas lain dalam asisten virtual berskala besar. Selain itu, dataset memiliki domain dan layanan yang tidak terlihat di set evaluasi untuk mengukur kinerja dalam pengaturan zero-shot atau beberapa shot.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Kode sumber :
tfds.datasets.schema_guided_dialogue.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
35.12 MiB
Ukuran dataset :
25.36 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 2.482 |
'test' | 4.201 |
'train' | 16.142 |
- Struktur fitur :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
pembicara_pertama | LabelKelas | int64 | ||
metadata | fiturDict | |||
metadata/layanan | Urutan | |||
metadata/layanan/nama | Tensor | rangkaian | ||
ucapan | Urutan (Teks) | (Tidak ada,) | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}