schema_guided_dialogue

  • Описание :

Набор данных Schema-Guided Dialogue (SGD) состоит из более чем 20 тысяч аннотированных многодоменных, ориентированных на задачи диалогов между человеком и виртуальным помощником. Эти разговоры включают взаимодействие со службами и API, охватывающими 20 доменов, от банков и событий до средств массовой информации, календаря, путешествий и погоды. Для большинства этих доменов набор данных содержит несколько различных API, многие из которых имеют дублирующие функции, но разные интерфейсы, что отражает распространенные сценарии реального мира. Широкий спектр доступных аннотаций можно использовать для прогнозирования намерений, заполнения слотов, отслеживания состояния диалога, изучения имитации политики, генерации языка, обучения имитации пользователя и других задач в крупномасштабных виртуальных помощниках. Помимо этого, в наборе данных есть неизвестные домены и службы в оценочном наборе для количественной оценки производительности в условиях нулевого выстрела или нескольких выстрелов.

Расколоть Примеры
'dev' 2482
'test' 4201
'train' 16 142
  • Особенности :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • Цитата :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}