schema_guided_dialogue

  • Mô tả :

Tập dữ liệu Đối thoại có hướng dẫn bằng lược đồ (SGD) bao gồm hơn 20 nghìn cuộc hội thoại đa miền, được chú thích theo hướng nhiệm vụ giữa con người và trợ lý ảo. Các cuộc trò chuyện này liên quan đến các tương tác với các dịch vụ và API trải dài 20 miền, từ ngân hàng và sự kiện đến phương tiện truyền thông, lịch, du lịch và thời tiết. Đối với hầu hết các miền này, tập dữ liệu chứa nhiều API khác nhau, nhiều API có chức năng chồng chéo nhưng giao diện khác nhau, phản ánh các tình huống phổ biến trong thế giới thực. Một loạt các chú thích có sẵn có thể được sử dụng để dự đoán ý định, lấp đầy vị trí, theo dõi trạng thái đối thoại, học bắt chước chính sách, tạo ngôn ngữ, học mô phỏng người dùng, trong số các tác vụ khác trong trợ lý ảo quy mô lớn. Bên cạnh những điều này, tập dữ liệu có các miền và dịch vụ chưa thấy trong tập hợp đánh giá để định lượng hiệu suất trong cài đặt không chụp hoặc ít cảnh quay.

Tách ra Các ví dụ
'dev' 2.482
'test' 4.201
'train' 16.142
  • Các tính năng :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • Trích dẫn :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}