- Açıklama :
Hükümet raporu veri seti, Kongre Araştırma Servisi ve ABD Hükümeti Sorumluluk Ofisi dahil olmak üzere devlet araştırma kurumları tarafından yazılan raporlardan oluşur.
Ek Belgeler : Belgeleri Keşfedin
Ana sayfa : https://gov-report-data.github.io/
Kaynak kodu :
tfds.summarization.gov_report.GovReportsürümler :
-
1.0.0(varsayılan): İlk sürüm.
-
İndirme boyutu :
320.59 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (varsayılan yapılandırma)
Yapılandırma açıklaması : Özetli CRS raporu. Boşluklarla düzleştirilmiş ve birleştirilmiş yapılar. Bu, orijinal kağıt tarafından kullanılan formattır.
Veri kümesi boyutu :
349.76 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Özellik yapısı :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| İD | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| raporlar | Metin | sicim | ||
| özet | Metin | sicim | ||
| Başlık | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('reports', 'summary')Örnekler ( tfds.as_dataframe ):
gov_report/gao_whitespace
Yapılandırma açıklaması : Düzleştirilmiş ve boşlukla birleştirilmiş Yapıları vurgulayan GAO raporu. Bu, orijinal kağıt tarafından kullanılan formattır.
Veri kümesi boyutu :
690.24 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Özellik yapısı :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| gerçek | Metin | sicim | ||
| vurgulamak | Metin | sicim | ||
| İD | Metin | sicim | ||
| yayınlanma tarihi | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| bildiri | Metin | sicim | ||
| Başlık | Metin | sicim | ||
| url | Metin | sicim |
Denetimli anahtarlar (Bkz
as_superviseddoc ):('report', 'highlight')Örnekler ( tfds.as_dataframe ):
gov_report/crs_html
Yapılandırma açıklaması : Özetli CRS raporu. Html etiketleri eklenirken yapılar düzleştirildi ve yeni satırla birleştirildi. Etiketler yalnızca secition_title için
<h2>xxx<h2>gibi bir biçimde eklenir.Veri kümesi boyutu :
351.25 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Özellik yapısı :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| İD | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| raporlar | Metin | sicim | ||
| özet | Metin | sicim | ||
| Başlık | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('reports', 'summary')Örnekler ( tfds.as_dataframe ):
gov_report/gao_html
Yapılandırma açıklaması : html etiketleri eklerken yeni satırla birleştirilmiş ve düzleştirilmiş Yapıları vurgulayan GAO raporu. Etiketler yalnızca secition_title için
<h2>xxx<h2>gibi bir biçimde eklenir.Veri kümesi boyutu :
692.72 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Özellik yapısı :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| gerçek | Metin | sicim | ||
| vurgulamak | Metin | sicim | ||
| İD | Metin | sicim | ||
| yayınlanma tarihi | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| bildiri | Metin | sicim | ||
| Başlık | Metin | sicim | ||
| url | Metin | sicim |
Denetimli anahtarlar (Bkz
as_superviseddoc ):('report', 'highlight')Örnekler ( tfds.as_dataframe ):
gov_report/crs_json
Yapılandırma açıklaması : Özetli CRS raporu. Ham json olarak temsil edilen yapılar.
Veri kümesi boyutu :
361.92 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Özellik yapısı :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| İD | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| raporlar | Metin | sicim | ||
| özet | Metin | sicim | ||
| Başlık | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('reports', 'summary')Örnekler ( tfds.as_dataframe ):
gov_report/gao_json
Yapılandırma açıklaması : Ham json olarak temsil edilen Yapıları vurgulayan GAO raporu.
Veri kümesi boyutu :
712.82 MiBbölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Özellik yapısı :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| gerçek | Metin | sicim | ||
| vurgulamak | Metin | sicim | ||
| İD | Metin | sicim | ||
| yayınlanma tarihi | Metin | sicim | ||
| Çıktığı tarih | Metin | sicim | ||
| bildiri | Metin | sicim | ||
| Başlık | Metin | sicim | ||
| url | Metin | sicim |
Denetimli anahtarlar (Bkz
as_superviseddoc ):('report', 'highlight')Örnekler ( tfds.as_dataframe ):