- opis :
Zbiór danych raportów rządowych składa się z raportów napisanych przez rządowe agencje badawcze, w tym Congressional Research Service i US Government Accountability Office.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://gov-report-data.github.io/
Kod źródłowy :
tfds.summarization.gov_report.GovReportWersje :
-
1.0.0(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
320.59 MiBAutomatyczne buforowanie ( dokumentacja ): Nie
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (domyślna konfiguracja)
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone odstępami. Jest to format używany przez oryginalny papier
Rozmiar zestawu danych :
349.76 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| ID | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raporty | Tekst | strunowy | ||
| streszczenie | Tekst | strunowy | ||
| tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('reports', 'summary')Przykłady ( tfds.as_dataframe ):
gov_report/gao_whitespace
Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi spacjami. Jest to format używany przez oryginalny papier
Rozmiar zestawu danych :
690.24 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| szybki fakt | Tekst | strunowy | ||
| atrakcja | Tekst | strunowy | ||
| ID | Tekst | strunowy | ||
| Data publikacji | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raport | Tekst | strunowy | ||
| tytuł | Tekst | strunowy | ||
| adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('report', 'highlight')Przykłady ( tfds.as_dataframe ):
gov_report/crs_html
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak
<h2>xxx<h2>.Rozmiar zestawu danych :
351.25 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| ID | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raporty | Tekst | strunowy | ||
| streszczenie | Tekst | strunowy | ||
| tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('reports', 'summary')Przykłady ( tfds.as_dataframe ):
gov_report/gao_html
Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak
<h2>xxx<h2>.Rozmiar zbioru danych :
692.72 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| szybki fakt | Tekst | strunowy | ||
| atrakcja | Tekst | strunowy | ||
| ID | Tekst | strunowy | ||
| Data publikacji | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raport | Tekst | strunowy | ||
| tytuł | Tekst | strunowy | ||
| adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('report', 'highlight')Przykłady ( tfds.as_dataframe ):
gov_report/crs_json
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury reprezentowane jako surowy json.
Rozmiar zestawu danych :
361.92 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| ID | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raporty | Tekst | strunowy | ||
| streszczenie | Tekst | strunowy | ||
| tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('reports', 'summary')Przykłady ( tfds.as_dataframe ):
gov_report/gao_json
Opis konfiguracji: raport GAO z wyróżnionymi strukturami przedstawionymi jako nieprzetworzony plik json.
Rozmiar zbioru danych :
712.82 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| szybki fakt | Tekst | strunowy | ||
| atrakcja | Tekst | strunowy | ||
| ID | Tekst | strunowy | ||
| Data publikacji | Tekst | strunowy | ||
| Data wypuszczenia | Tekst | strunowy | ||
| raport | Tekst | strunowy | ||
| tytuł | Tekst | strunowy | ||
| adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('report', 'highlight')Przykłady ( tfds.as_dataframe ):