- Descripción :
Tablas de Wikipedia con al menos 3 filas y 2 columnas, se seleccionaron 3 filas aleatorias para cada tabla para su posterior anotación. Cada fila fue anotada por una persona diferente, por lo que el conjunto de datos está compuesto por pares (tabla de una fila, descripción de texto). Las anotaciones incluyen al menos 2 celdas de la fila, pero no es necesario incluirlas todas. El conjunto de datos sigue un formato de tabla estandarizado.
Página de inicio: https://github.com/msra-nlc/Table2Text
Código fuente :
tfds.structured.wiki_table_text.WikiTableText
Versiones :
-
1.0.0
(predeterminado): Versión inicial.
-
Tamaño de descarga :
3.70 MiB
Tamaño del conjunto de datos :
4.64 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 10,000 |
'validation' | 1,318 |
- Estructura de características :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
texto de entrada | CaracterísticasDict | |||
entrada_texto/tabla | Secuencia | |||
texto_de_entrada/tabla/encabezado_de_columna | Tensor | cuerda | ||
entrada_texto/tabla/contenido | Tensor | cuerda | ||
texto_de_entrada/tabla/número_de_fila | Tensor | int16 | ||
texto_objetivo | Tensor | cuerda |
Teclas supervisadas (Ver
as_supervised
doc ):('input_text', 'target_text')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}