gov_report

  • Deskripsi :

Kumpulan data laporan pemerintah terdiri dari laporan yang ditulis oleh lembaga penelitian pemerintah termasuk Layanan Penelitian Kongres dan Kantor Akuntabilitas Pemerintah AS.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (konfigurasi default)

  • Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli

  • Ukuran dataset : 349.76 MiB

  • Perpecahan :

Membelah Contoh
'test' 362
'train' 6.514
'validation' 362
  • Struktur fitur :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
Indo Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
ringkasan Teks rangkaian
judul Teks rangkaian

gov_report/gao_whitespace

  • Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli

  • Ukuran dataset : 690.24 MiB

  • Perpecahan :

Membelah Contoh
'test' 611
'train' 11.005
'validation' 612
  • Struktur fitur :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
fastfact Teks rangkaian
menyorot Teks rangkaian
Indo Teks rangkaian
Tanggal publikasi Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
judul Teks rangkaian
url Teks rangkaian

gov_report/crs_html

  • Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti <h2>xxx<h2> .

  • Ukuran dataset : 351.25 MiB

  • Perpecahan :

Membelah Contoh
'test' 362
'train' 6.514
'validation' 362
  • Struktur fitur :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
Indo Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
ringkasan Teks rangkaian
judul Teks rangkaian

gov_report/gao_html

  • Deskripsi konfigurasi : Laporan GAO dengan struktur sorotan diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti <h2>xxx<h2> .

  • Ukuran dataset : 692.72 MiB

  • Perpecahan :

Membelah Contoh
'test' 611
'train' 11.005
'validation' 612
  • Struktur fitur :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
fastfact Teks rangkaian
menyorot Teks rangkaian
Indo Teks rangkaian
Tanggal publikasi Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
judul Teks rangkaian
url Teks rangkaian

gov_report/crs_json

  • Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur direpresentasikan sebagai json mentah.

  • Ukuran dataset : 361.92 MiB

  • Perpecahan :

Membelah Contoh
'test' 362
'train' 6.514
'validation' 362
  • Struktur fitur :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
Indo Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
ringkasan Teks rangkaian
judul Teks rangkaian

gov_report/gao_json

  • Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur direpresentasikan sebagai json mentah.

  • Ukuran dataset : 712.82 MiB

  • Perpecahan :

Membelah Contoh
'test' 611
'train' 11.005
'validation' 612
  • Struktur fitur :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
fastfact Teks rangkaian
menyorot Teks rangkaian
Indo Teks rangkaian
Tanggal publikasi Teks rangkaian
tanggal_dirilis Teks rangkaian
laporan Teks rangkaian
judul Teks rangkaian
url Teks rangkaian