- Descrição :
Tabelas da Wikipedia com pelo menos 3 linhas e 2 colunas, 3 linhas aleatórias para cada tabela foram selecionadas para anotações posteriores. Cada linha foi anotada por uma pessoa diferente, então o conjunto de dados é composto por pares (uma tabela de linha, descrição de texto). As anotações incluem pelo menos 2 células da linha, mas não precisam incluir todas elas. O conjunto de dados segue um formato de tabela padronizado.
Página inicial : https://github.com/msra-nlc/Table2Text
Código -fonte:
tfds.structured.wiki_table_text.WikiTableText
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
3.70 MiB
Tamanho do conjunto de dados :
4.64 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 10.000 |
'validation' | 1.318 |
- Estrutura de recursos :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Entrada de texto | RecursosDict | |||
texto_entrada/tabela | Seqüência | |||
input_text/table/column_header | tensor | corda | ||
texto_entrada/tabela/conteúdo | tensor | corda | ||
input_text/table/row_number | tensor | int16 | ||
texto_alvo | tensor | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('input_text', 'target_text')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}