- 説明:
政府レポート データセットは、議会調査サービスや米国政府説明責任局などの政府調査機関によって作成されたレポートで構成されています。
追加のドキュメント:コード を使用したペーパーの探索
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
320.59 MiB
自動キャッシュ(ドキュメント): いいえ
図( tfds.show_examples ): サポートされていません。
引用:
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (デフォルト設定)
構成の説明: 要約付きの CRS レポート。平坦化され、空白で結合された構造。これは元の用紙で使用される形式です
データセットのサイズ:
349.76 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- 機能構造:
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ID | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
レポート | 文章 | ストリング | ||
まとめ | 文章 | ストリング | ||
題名 | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('reports', 'summary')
例( tfds.as_dataframe ):
gov_report/gao_whitespace
構成の説明: 強調表示された構造体が平坦化され、空白で結合された GAO レポート。これは元の用紙で使用される形式です
データセットサイズ:
690.24 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- 機能構造:
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファストファクト | 文章 | ストリング | ||
ハイライト | 文章 | ストリング | ||
ID | 文章 | ストリング | ||
公開日 | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
報告 | 文章 | ストリング | ||
題名 | 文章 | ストリング | ||
URL | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('report', 'highlight')
例( tfds.as_dataframe ):
gov_report/crs_html
構成の説明: 要約付きの CRS レポート。 html タグを追加する際に改行で結合され、フラット化された構造。タグは
<h2>xxx<h2>
のような形式で section_title にのみ追加されます。データセットサイズ:
351.25 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- 機能構造:
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ID | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
レポート | 文章 | ストリング | ||
まとめ | 文章 | ストリング | ||
題名 | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('reports', 'summary')
例( tfds.as_dataframe ):
gov_report/gao_html
構成の説明: HTML タグを追加しながら、フラット化され改行で結合されたハイライト構造を含む GAO レポート。タグは
<h2>xxx<h2>
のような形式で section_title にのみ追加されます。データセットサイズ:
692.72 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- 機能構造:
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファストファクト | 文章 | ストリング | ||
ハイライト | 文章 | ストリング | ||
ID | 文章 | ストリング | ||
公開日 | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
報告 | 文章 | ストリング | ||
題名 | 文章 | ストリング | ||
URL | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('report', 'highlight')
例( tfds.as_dataframe ):
gov_report/crs_json
構成の説明: 要約付きの CRS レポート。生の json として表される構造。
データセットサイズ:
361.92 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- 機能構造:
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ID | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
レポート | 文章 | ストリング | ||
まとめ | 文章 | ストリング | ||
題名 | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('reports', 'summary')
例( tfds.as_dataframe ):
gov_report/gao_json
構成の説明: 生の json として表される構造体を強調表示した GAO レポート。
データセットサイズ:
712.82 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- 機能構造:
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファストファクト | 文章 | ストリング | ||
ハイライト | 文章 | ストリング | ||
ID | 文章 | ストリング | ||
公開日 | 文章 | ストリング | ||
リリース日 | 文章 | ストリング | ||
報告 | 文章 | ストリング | ||
題名 | 文章 | ストリング | ||
URL | 文章 | ストリング |
監視キー(
as_supervised
docを参照):('report', 'highlight')
例( tfds.as_dataframe ):