gov_report

  • 説明:

政府レポート データセットは、議会調査サービスや米国政府説明責任局などの政府調査機関によって作成されたレポートで構成されています。

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (デフォルト設定)

  • 構成の説明: 要約付きの CRS レポート。平坦化され、空白で結合された構造。これは元の用紙で使用される形式です

  • データセットのサイズ: 349.76 MiB

  • スプリット:

スプリット
'test' 362
'train' 6,514
'validation' 362
  • 機能構造:
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ID文章ストリング
リリース日文章ストリング
レポート文章ストリング
まとめ文章ストリング
題名文章ストリング

gov_report/gao_whitespace

  • 構成の説明: 強調表示された構造体が平坦化され、空白で結合された GAO レポート。これは元の用紙で使用される形式です

  • データセットサイズ: 690.24 MiB

  • スプリット:

スプリット
'test' 611
'train' 11,005
'validation' 612
  • 機能構造:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファストファクト文章ストリング
ハイライト文章ストリング
ID文章ストリング
公開日文章ストリング
リリース日文章ストリング
報告文章ストリング
題名文章ストリング
URL文章ストリング

gov_report/crs_html

  • 構成の説明: 要約付きの CRS レポート。 html タグを追加する際に改行で結合され、フラット化された構造。タグは<h2>xxx<h2>のような形式で section_title にのみ追加されます。

  • データセットサイズ: 351.25 MiB

  • スプリット:

スプリット
'test' 362
'train' 6,514
'validation' 362
  • 機能構造:
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ID文章ストリング
リリース日文章ストリング
レポート文章ストリング
まとめ文章ストリング
題名文章ストリング

gov_report/gao_html

  • 構成の説明: HTML タグを追加しながら、フラット化され改行で結合されたハイライト構造を含む GAO レポート。タグは<h2>xxx<h2>のような形式で section_title にのみ追加されます。

  • データセットサイズ: 692.72 MiB

  • スプリット:

スプリット
'test' 611
'train' 11,005
'validation' 612
  • 機能構造:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファストファクト文章ストリング
ハイライト文章ストリング
ID文章ストリング
公開日文章ストリング
リリース日文章ストリング
報告文章ストリング
題名文章ストリング
URL文章ストリング

gov_report/crs_json

  • 構成の説明: 要約付きの CRS レポート。生の json として表される構造。

  • データセットサイズ: 361.92 MiB

  • スプリット:

スプリット
'test' 362
'train' 6,514
'validation' 362
  • 機能構造:
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ID文章ストリング
リリース日文章ストリング
レポート文章ストリング
まとめ文章ストリング
題名文章ストリング

gov_report/gao_json

  • 構成の説明: 生の json として表される構造体を強調表示した GAO レポート。

  • データセットサイズ: 712.82 MiB

  • スプリット:

スプリット
'test' 611
'train' 11,005
'validation' 612
  • 機能構造:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファストファクト文章ストリング
ハイライト文章ストリング
ID文章ストリング
公開日文章ストリング
リリース日文章ストリング
報告文章ストリング
題名文章ストリング
URL文章ストリング