- opis :
Tabele Wikipedii z co najmniej 3 wierszami i 2 kolumnami, po 3 losowe wiersze dla każdej tabeli, zostały wybrane do dalszych adnotacji. Każdy wiersz został opatrzony adnotacją przez inną osobę, więc zbiór danych składa się z par (tabela z jednym wierszem, opis tekstowy). Adnotacje obejmują co najmniej 2 komórki wiersza, ale nie wymagają uwzględnienia ich wszystkich. Zestaw danych jest zgodny ze znormalizowanym formatem tabeli.
Strona główna : https://github.com/msra-nlc/Table2Text
Kod źródłowy :
tfds.structured.wiki_table_text.WikiTableText
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
3.70 MiB
Rozmiar zestawu danych :
4.64 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 2000 |
'train' | 10 000 |
'validation' | 1318 |
- Struktura funkcji :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
Wprowadź tekst | FunkcjeDict | |||
tekst_wejściowy/tabela | Sekwencja | |||
tekst_wejściowy/tabela/nagłówek_kolumny | Napinacz | strunowy | ||
tekst_wejściowy/tabela/treść | Napinacz | strunowy | ||
tekst_wejściowy/tabela/numer_wiersza | Napinacz | int16 | ||
tekst_docelowy | Napinacz | strunowy |
Nadzorowane klucze (zobacz dokument
as_supervised
):('input_text', 'target_text')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}