
  • Descrizione :

Il set di dati dei rapporti governativi è costituito da rapporti scritti da agenzie di ricerca governative, tra cui il Congressional Research Service e l'US Government Accountability Office.

={Efficiently Modeling Long Sequences with Structured State Spaces},
={Submitted to The Tenth International Conference on Learning Representations },
={under review}

gov_report/crs_whitespace (configurazione predefinita)

  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale

  • Dimensione del set di dati: 349.76 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda


  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale

  • Dimensione del set di dati: 690.24 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda


  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da newline durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come <h2>xxx<h2> .

  • Dimensione del set di dati: 351.25 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda


  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da una nuova riga durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come <h2>xxx<h2> .

  • Dimensione del set di dati: 692.72 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda


  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture rappresentate come raw json.

  • Dimensione del set di dati: 361.92 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda


  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture rappresentate come raw json.

  • Dimensione del set di dati: 712.82 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda