- Deskripsi :
Kumpulan data laporan pemerintah terdiri dari laporan yang ditulis oleh lembaga penelitian pemerintah termasuk Layanan Penelitian Kongres dan Kantor Akuntabilitas Pemerintah AS.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://gov-report-data.github.io/
Kode sumber :
tfds.summarization.gov_report.GovReportVersi :
-
1.0.0(default): Rilis awal.
-
Ukuran unduhan :
320.59 MiBDi-cache otomatis ( dokumentasi ): Tidak
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (konfigurasi default)
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli
Ukuran dataset :
349.76 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| Indo | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| ringkasan | Teks | rangkaian | ||
| judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('reports', 'summary')Contoh ( tfds.as_dataframe ):
gov_report/gao_whitespace
Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli
Ukuran dataset :
690.24 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| fastfact | Teks | rangkaian | ||
| menyorot | Teks | rangkaian | ||
| Indo | Teks | rangkaian | ||
| Tanggal publikasi | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| judul | Teks | rangkaian | ||
| url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('report', 'highlight')Contoh ( tfds.as_dataframe ):
gov_report/crs_html
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti
<h2>xxx<h2>.Ukuran dataset :
351.25 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| Indo | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| ringkasan | Teks | rangkaian | ||
| judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('reports', 'summary')Contoh ( tfds.as_dataframe ):
gov_report/gao_html
Deskripsi konfigurasi : Laporan GAO dengan struktur sorotan diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti
<h2>xxx<h2>.Ukuran dataset :
692.72 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| fastfact | Teks | rangkaian | ||
| menyorot | Teks | rangkaian | ||
| Indo | Teks | rangkaian | ||
| Tanggal publikasi | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| judul | Teks | rangkaian | ||
| url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('report', 'highlight')Contoh ( tfds.as_dataframe ):
gov_report/crs_json
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur direpresentasikan sebagai json mentah.
Ukuran dataset :
361.92 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| Indo | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| ringkasan | Teks | rangkaian | ||
| judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('reports', 'summary')Contoh ( tfds.as_dataframe ):
gov_report/gao_json
Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur direpresentasikan sebagai json mentah.
Ukuran dataset :
712.82 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| fastfact | Teks | rangkaian | ||
| menyorot | Teks | rangkaian | ||
| Indo | Teks | rangkaian | ||
| Tanggal publikasi | Teks | rangkaian | ||
| tanggal_dirilis | Teks | rangkaian | ||
| laporan | Teks | rangkaian | ||
| judul | Teks | rangkaian | ||
| url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('report', 'highlight')Contoh ( tfds.as_dataframe ):