- Descrição :
O conjunto de dados Schema-Guided Dialogue (SGD) consiste em mais de 20 mil conversas multidomínio anotadas e orientadas a tarefas entre um humano e um assistente virtual. Essas conversas envolvem interações com serviços e APIs abrangendo 20 domínios, desde bancos e eventos até mídia, calendário, viagens e clima. Para a maioria desses domínios, o conjunto de dados contém várias APIs diferentes, muitas das quais têm funcionalidades sobrepostas, mas interfaces diferentes, o que reflete cenários comuns do mundo real. A ampla gama de anotações disponíveis pode ser usada para previsão de intenção, preenchimento de slots, rastreamento de estado de diálogo, aprendizado de imitação de política, geração de linguagem, aprendizado de simulação de usuário, entre outras tarefas em assistentes virtuais de grande escala. Além desses, o conjunto de dados possui domínios e serviços não vistos no conjunto de avaliação para quantificar o desempenho em configurações de disparo zero ou poucos disparos.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Código -fonte:
tfds.datasets.schema_guided_dialogue.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
35.12 MiB
Tamanho do conjunto de dados :
25.36 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 2.482 |
'test' | 4.201 |
'train' | 16.142 |
- Estrutura de recursos :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
primeiro_falante | ClassLabel | int64 | ||
metadados | RecursosDict | |||
metadados/serviços | Seqüência | |||
metadados/serviços/nome | tensor | fragmento | ||
enunciados | Sequência (Texto) | (Nenhum,) | fragmento |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}