- Deskripsi :
Kumpulan data laporan pemerintah terdiri dari laporan yang ditulis oleh lembaga penelitian pemerintah termasuk Layanan Penelitian Kongres dan Kantor Akuntabilitas Pemerintah AS.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://gov-report-data.github.io/
Kode sumber :
tfds.summarization.gov_report.GovReport
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
320.59 MiB
Di-cache otomatis ( dokumentasi ): Tidak
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (konfigurasi default)
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli
Ukuran dataset :
349.76 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Indo | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
ringkasan | Teks | rangkaian | ||
judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('reports', 'summary')
Contoh ( tfds.as_dataframe ):
gov_report/gao_whitespace
Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur diratakan dan digabungkan dengan spasi putih. Ini adalah format yang digunakan oleh kertas asli
Ukuran dataset :
690.24 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
fastfact | Teks | rangkaian | ||
menyorot | Teks | rangkaian | ||
Indo | Teks | rangkaian | ||
Tanggal publikasi | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
judul | Teks | rangkaian | ||
url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('report', 'highlight')
Contoh ( tfds.as_dataframe ):
gov_report/crs_html
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti
<h2>xxx<h2>
.Ukuran dataset :
351.25 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Indo | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
ringkasan | Teks | rangkaian | ||
judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('reports', 'summary')
Contoh ( tfds.as_dataframe ):
gov_report/gao_html
Deskripsi konfigurasi : Laporan GAO dengan struktur sorotan diratakan dan digabungkan dengan baris baru sambil menambahkan tag html. Tag hanya ditambahkan untuk section_title dalam format seperti
<h2>xxx<h2>
.Ukuran dataset :
692.72 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
fastfact | Teks | rangkaian | ||
menyorot | Teks | rangkaian | ||
Indo | Teks | rangkaian | ||
Tanggal publikasi | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
judul | Teks | rangkaian | ||
url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('report', 'highlight')
Contoh ( tfds.as_dataframe ):
gov_report/crs_json
Deskripsi konfigurasi : Laporan CRS dengan ringkasan. Struktur direpresentasikan sebagai json mentah.
Ukuran dataset :
361.92 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Indo | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
ringkasan | Teks | rangkaian | ||
judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('reports', 'summary')
Contoh ( tfds.as_dataframe ):
gov_report/gao_json
Deskripsi konfigurasi : Laporan GAO dengan sorotan Struktur direpresentasikan sebagai json mentah.
Ukuran dataset :
712.82 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struktur fitur :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
fastfact | Teks | rangkaian | ||
menyorot | Teks | rangkaian | ||
Indo | Teks | rangkaian | ||
Tanggal publikasi | Teks | rangkaian | ||
tanggal_dirilis | Teks | rangkaian | ||
laporan | Teks | rangkaian | ||
judul | Teks | rangkaian | ||
url | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('report', 'highlight')
Contoh ( tfds.as_dataframe ):