relatório_gov

  • Descrição :

O conjunto de dados de relatórios do governo consiste em relatórios escritos por agências de pesquisa do governo, incluindo o Congressional Research Service e o US Government Accountability Office.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (configuração padrão)

  • Descrição da configuração : relatório CRS com resumo. Estruturas achatadas e unidas por espaços em branco. Este é o formato usado pelo papel original

  • Tamanho do conjunto de dados : 349.76 MiB

  • Divisões :

Dividir Exemplos
'test' 362
'train' 6.514
'validation' 362
  • Estrutura de recursos :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
Eu iria Texto corda
data de lançamento Texto corda
relatórios Texto corda
resumo Texto corda
título Texto corda

gov_report/gao_whitespace

  • Descrição da configuração : relatório do GAO com estruturas de destaque niveladas e unidas por espaços em branco. Este é o formato usado pelo papel original

  • Tamanho do conjunto de dados : 690.24 MiB

  • Divisões :

Dividir Exemplos
'test' 611
'train' 11.005
'validation' 612
  • Estrutura de recursos :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
fato rápido Texto corda
realçar Texto corda
Eu iria Texto corda
data_publicada Texto corda
data de lançamento Texto corda
relatório Texto corda
título Texto corda
url Texto corda

gov_report/crs_html

  • Descrição da configuração : relatório CRS com resumo. Estruturas niveladas e unidas por nova linha enquanto adicionam tags html. As tags são adicionadas apenas para section_title em um formato como <h2>xxx<h2> .

  • Tamanho do conjunto de dados : 351.25 MiB

  • Divisões :

Dividir Exemplos
'test' 362
'train' 6.514
'validation' 362
  • Estrutura de recursos :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
Eu iria Texto corda
data de lançamento Texto corda
relatórios Texto corda
resumo Texto corda
título Texto corda

gov_report/gao_html

  • Descrição da configuração : relatório do GAO com estruturas de destaque niveladas e unidas por nova linha ao adicionar tags html. As tags são adicionadas apenas para section_title em um formato como <h2>xxx<h2> .

  • Tamanho do conjunto de dados : 692.72 MiB

  • Divisões :

Dividir Exemplos
'test' 611
'train' 11.005
'validation' 612
  • Estrutura de recursos :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
fato rápido Texto corda
realçar Texto corda
Eu iria Texto corda
data_publicada Texto corda
data de lançamento Texto corda
relatório Texto corda
título Texto corda
url Texto corda

gov_report/crs_json

  • Descrição da configuração : relatório CRS com resumo. Estruturas representadas como json bruto.

  • Tamanho do conjunto de dados : 361.92 MiB

  • Divisões :

Dividir Exemplos
'test' 362
'train' 6.514
'validation' 362
  • Estrutura de recursos :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
Eu iria Texto corda
data de lançamento Texto corda
relatórios Texto corda
resumo Texto corda
título Texto corda

gov_report/gao_json

  • Descrição da configuração : relatório do GAO com estruturas de destaque representadas como json bruto.

  • Tamanho do conjunto de dados : 712.82 MiB

  • Divisões :

Dividir Exemplos
'test' 611
'train' 11.005
'validation' 612
  • Estrutura de recursos :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
fato rápido Texto corda
realçar Texto corda
Eu iria Texto corda
data_publicada Texto corda
data de lançamento Texto corda
relatório Texto corda
título Texto corda
url Texto corda