- Descrição :
BillSum, resumo dos projetos de lei do Congresso dos EUA e do estado da Califórnia.
Existem vários recursos: - texto: texto da conta. - sumário: resumo das contas. - título: título das contas. recursos para nós contas. ca contas não tem. - text_len: número de caracteres no texto. - sum_len: número de caracteres no resumo.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/FiscalNote/BillSum
Código-fonte :
tfds.datasets.billsum.Builder
Versões :
-
3.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
64.14 MiB
Tamanho do conjunto de dados :
260.84 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'ca_test' | 1.237 |
'test' | 3.269 |
'train' | 18.949 |
- Estrutura de recursos :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentação do recurso :
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
resumo | Texto | corda | ||
texto | Texto | corda | ||
título | Texto | corda |
Chaves supervisionadas (Veja
as_supervised
doc ):('text', 'summary')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}