- Descrição :
O conjunto de dados contém os pares tabela-pergunta e a respectiva resposta. As perguntas requerem raciocínio em várias etapas e várias operações de dados, como comparação, agregação e cálculo aritmético. As tabelas foram selecionadas aleatoriamente entre as tabelas da Wikipédia com pelo menos 8 linhas e 5 colunas.
(Conforme as notas de uso da documentação)
Dev: Precisão média em três (não cinco) divisões dos dados de treinamento. Em outras palavras, treine em 'split-{1,2,3}-train' e teste em 'split-{1,2,3}-dev', respectivamente, e faça a média da precisão.
Teste: Treine em 'trem' e teste em 'teste'.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Código -fonte:
tfds.structured.wiki_table_questions.WikiTableQuestions
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
65.36 MiB
Tamanho do conjunto de dados :
237.24 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'split-1-dev' | 2.810 |
'split-1-train' | 11.321 |
'split-2-dev' | 2.838 |
'split-2-train' | 11.312 |
'split-3-dev' | 2.838 |
'split-3-train' | 11.311 |
'test' | 4.344 |
'train' | 14.149 |
- Estrutura de recursos :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Entrada de texto | RecursosDict | |||
input_text/contexto | tensor | corda | ||
texto_entrada/tabela | Seqüência | |||
input_text/table/column_header | tensor | corda | ||
texto_entrada/tabela/conteúdo | tensor | corda | ||
input_text/table/row_number | tensor | int16 | ||
texto_alvo | tensor | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('input_text', 'target_text')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}