
  • Descripción :

El conjunto de datos de informes gubernamentales consiste en informes escritos por agencias de investigación gubernamentales, incluido el Servicio de Investigación del Congreso y la Oficina de Responsabilidad del Gobierno de EE. UU.

={Efficiently Modeling Long Sequences with Structured State Spaces},
={Submitted to The Tenth International Conference on Learning Representations },
={under review}

gov_report/crs_whitespace (configuración predeterminada)

  • Descripción de la configuración : informe CRS con resumen. Estructuras aplanadas y unidas por espacios en blanco. Este es el formato utilizado por el papel original

  • Tamaño del conjunto de datos : 349.76 MiB

  • Divisiones :

Separar Ejemplos
'test' 362
'train' 6,514
'validation' 362
  • Estructura de características :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
identificación Texto cuerda
fecha de lanzamiento Texto cuerda
informes Texto cuerda
resumen Texto cuerda
título Texto cuerda

gov_report/gao_espacio en blanco

  • Descripción de la configuración : informe GAO con estructuras resaltadas aplanadas y unidas por espacios en blanco. Este es el formato utilizado por el papel original

  • Tamaño del conjunto de datos : 690.24 MiB

  • Divisiones :

Separar Ejemplos
'test' 611
'train' 11,005
'validation' 612
  • Estructura de características :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
hecho rápido Texto cuerda
destacar Texto cuerda
identificación Texto cuerda
Fecha de Publicación Texto cuerda
fecha de lanzamiento Texto cuerda
reporte Texto cuerda
título Texto cuerda
URL Texto cuerda


  • Descripción de la configuración : informe CRS con resumen. Estructuras aplanadas y unidas por nueva línea mientras se agregan etiquetas html. Las etiquetas solo se agregan para section_title en un formato como <h2>xxx<h2> .

  • Tamaño del conjunto de datos : 351.25 MiB

  • Divisiones :

Separar Ejemplos
'test' 362
'train' 6,514
'validation' 362
  • Estructura de características :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
identificación Texto cuerda
fecha de lanzamiento Texto cuerda
informes Texto cuerda
resumen Texto cuerda
título Texto cuerda


  • Descripción de la configuración : informe GAO con estructuras resaltadas aplanadas y unidas por nueva línea mientras se agregan etiquetas html. Las etiquetas solo se agregan para section_title en un formato como <h2>xxx<h2> .

  • Tamaño del conjunto de datos : 692.72 MiB

  • Divisiones :

Separar Ejemplos
'test' 611
'train' 11,005
'validation' 612
  • Estructura de características :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
hecho rápido Texto cuerda
destacar Texto cuerda
identificación Texto cuerda
Fecha de Publicación Texto cuerda
fecha de lanzamiento Texto cuerda
reporte Texto cuerda
título Texto cuerda
URL Texto cuerda


  • Descripción de la configuración : informe CRS con resumen. Estructuras representadas como raw json.

  • Tamaño del conjunto de datos : 361.92 MiB

  • Divisiones :

Separar Ejemplos
'test' 362
'train' 6,514
'validation' 362
  • Estructura de características :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
identificación Texto cuerda
fecha de lanzamiento Texto cuerda
informes Texto cuerda
resumen Texto cuerda
título Texto cuerda


  • Descripción de la configuración : informe GAO con estructuras destacadas representadas como json sin procesar.

  • Tamaño del conjunto de datos : 712.82 MiB

  • Divisiones :

Separar Ejemplos
'test' 611
'train' 11,005
'validation' 612
  • Estructura de características :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
hecho rápido Texto cuerda
destacar Texto cuerda
identificación Texto cuerda
Fecha de Publicación Texto cuerda
fecha de lanzamiento Texto cuerda
reporte Texto cuerda
título Texto cuerda
URL Texto cuerda