- Descrição :
O conjunto de dados de relatórios do governo consiste em relatórios escritos por agências de pesquisa do governo, incluindo o Congressional Research Service e o US Government Accountability Office.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://gov-report-data.github.io/
Código -fonte:
tfds.summarization.gov_report.GovReport
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
320.59 MiB
Armazenado em cache automaticamente ( documentação ): Não
Figura ( tfds.show_examples ): Não compatível.
Citação :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (configuração padrão)
Descrição da configuração : relatório CRS com resumo. Estruturas achatadas e unidas por espaços em branco. Este é o formato usado pelo papel original
Tamanho do conjunto de dados :
349.76 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Estrutura de recursos :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Eu iria | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatórios | Texto | corda | ||
resumo | Texto | corda | ||
título | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('reports', 'summary')
Exemplos ( tfds.as_dataframe ):
gov_report/gao_whitespace
Descrição da configuração : relatório do GAO com estruturas de destaque niveladas e unidas por espaços em branco. Este é o formato usado pelo papel original
Tamanho do conjunto de dados :
690.24 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Estrutura de recursos :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
fato rápido | Texto | corda | ||
realçar | Texto | corda | ||
Eu iria | Texto | corda | ||
data_publicada | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatório | Texto | corda | ||
título | Texto | corda | ||
url | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('report', 'highlight')
Exemplos ( tfds.as_dataframe ):
gov_report/crs_html
Descrição da configuração : relatório CRS com resumo. Estruturas niveladas e unidas por nova linha enquanto adicionam tags html. As tags são adicionadas apenas para section_title em um formato como
<h2>xxx<h2>
.Tamanho do conjunto de dados :
351.25 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Estrutura de recursos :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Eu iria | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatórios | Texto | corda | ||
resumo | Texto | corda | ||
título | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('reports', 'summary')
Exemplos ( tfds.as_dataframe ):
gov_report/gao_html
Descrição da configuração : relatório do GAO com estruturas de destaque niveladas e unidas por nova linha ao adicionar tags html. As tags são adicionadas apenas para section_title em um formato como
<h2>xxx<h2>
.Tamanho do conjunto de dados :
692.72 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Estrutura de recursos :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
fato rápido | Texto | corda | ||
realçar | Texto | corda | ||
Eu iria | Texto | corda | ||
data_publicada | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatório | Texto | corda | ||
título | Texto | corda | ||
url | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('report', 'highlight')
Exemplos ( tfds.as_dataframe ):
gov_report/crs_json
Descrição da configuração : relatório CRS com resumo. Estruturas representadas como json bruto.
Tamanho do conjunto de dados :
361.92 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Estrutura de recursos :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Eu iria | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatórios | Texto | corda | ||
resumo | Texto | corda | ||
título | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('reports', 'summary')
Exemplos ( tfds.as_dataframe ):
gov_report/gao_json
Descrição da configuração : relatório do GAO com estruturas de destaque representadas como json bruto.
Tamanho do conjunto de dados :
712.82 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Estrutura de recursos :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
fato rápido | Texto | corda | ||
realçar | Texto | corda | ||
Eu iria | Texto | corda | ||
data_publicada | Texto | corda | ||
data de lançamento | Texto | corda | ||
relatório | Texto | corda | ||
título | Texto | corda | ||
url | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('report', 'highlight')
Exemplos ( tfds.as_dataframe ):