gov_report

  • Açıklama :

Hükümet raporu veri seti, Kongre Araştırma Servisi ve ABD Hükümeti Sorumluluk Ofisi dahil olmak üzere devlet araştırma kurumları tarafından yazılan raporlardan oluşur.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Özetli CRS raporu. Boşluklarla düzleştirilmiş ve birleştirilmiş yapılar. Bu, orijinal kağıt tarafından kullanılan formattır.

  • Veri kümesi boyutu : 349.76 MiB

  • bölmeler :

Bölmek örnekler
'test' 362
'train' 6.514
'validation' 362
  • Özellik yapısı :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
İD Metin sicim
Çıktığı tarih Metin sicim
raporlar Metin sicim
özet Metin sicim
Başlık Metin sicim

gov_report/gao_whitespace

  • Yapılandırma açıklaması : Düzleştirilmiş ve boşlukla birleştirilmiş Yapıları vurgulayan GAO raporu. Bu, orijinal kağıt tarafından kullanılan formattır.

  • Veri kümesi boyutu : 690.24 MiB

  • bölmeler :

Bölmek örnekler
'test' 611
'train' 11.005
'validation' 612
  • Özellik yapısı :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
gerçek Metin sicim
vurgulamak Metin sicim
İD Metin sicim
yayınlanma tarihi Metin sicim
Çıktığı tarih Metin sicim
bildiri Metin sicim
Başlık Metin sicim
url Metin sicim

gov_report/crs_html

  • Yapılandırma açıklaması : Özetli CRS raporu. Html etiketleri eklenirken yapılar düzleştirildi ve yeni satırla birleştirildi. Etiketler yalnızca secition_title için <h2>xxx<h2> gibi bir biçimde eklenir.

  • Veri kümesi boyutu : 351.25 MiB

  • bölmeler :

Bölmek örnekler
'test' 362
'train' 6.514
'validation' 362
  • Özellik yapısı :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
İD Metin sicim
Çıktığı tarih Metin sicim
raporlar Metin sicim
özet Metin sicim
Başlık Metin sicim

gov_report/gao_html

  • Yapılandırma açıklaması : html etiketleri eklerken yeni satırla birleştirilmiş ve düzleştirilmiş Yapıları vurgulayan GAO raporu. Etiketler yalnızca secition_title için <h2>xxx<h2> gibi bir biçimde eklenir.

  • Veri kümesi boyutu : 692.72 MiB

  • bölmeler :

Bölmek örnekler
'test' 611
'train' 11.005
'validation' 612
  • Özellik yapısı :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
gerçek Metin sicim
vurgulamak Metin sicim
İD Metin sicim
yayınlanma tarihi Metin sicim
Çıktığı tarih Metin sicim
bildiri Metin sicim
Başlık Metin sicim
url Metin sicim

gov_report/crs_json

  • Yapılandırma açıklaması : Özetli CRS raporu. Ham json olarak temsil edilen yapılar.

  • Veri kümesi boyutu : 361.92 MiB

  • bölmeler :

Bölmek örnekler
'test' 362
'train' 6.514
'validation' 362
  • Özellik yapısı :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
İD Metin sicim
Çıktığı tarih Metin sicim
raporlar Metin sicim
özet Metin sicim
Başlık Metin sicim

gov_report/gao_json

  • Yapılandırma açıklaması : Ham json olarak temsil edilen Yapıları vurgulayan GAO raporu.

  • Veri kümesi boyutu : 712.82 MiB

  • bölmeler :

Bölmek örnekler
'test' 611
'train' 11.005
'validation' 612
  • Özellik yapısı :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
gerçek Metin sicim
vurgulamak Metin sicim
İD Metin sicim
yayınlanma tarihi Metin sicim
Çıktığı tarih Metin sicim
bildiri Metin sicim
Başlık Metin sicim
url Metin sicim