人種

説明:

Race は、28,000 を超えるパッセージと 100,000 近くの問題を含む大規模な読解データセットです。このデータセットは、中学生と高校生を対象とした中国の英語試験から収集されています。データセットは、機械理解のトレーニングセットとテストセットとして使用できます。

追加のドキュメント:コードを使用したペーパーの探索
構成の説明: RACE データセットのビルダー構成。
ホームページ: https://www.cs.cmu.edu/~glai1/data/race/
ソースコード: tfds.datasets.race.Builder
バージョン:
- 1.0.0 : 初期リリース。
- 2.0.0 (デフォルト): サンプル ID を追加します。
ダウンロードサイズ: 24.26 MiB
自動キャッシュ(ドキュメント): はい
機能構造:

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})

機能のドキュメント:

特徴	クラス	形	Dtype
	特徴辞書
答え	シーケンス(テキスト)	（なし、）	ストリング
記事	文章		ストリング
example_id	文章		ストリング
オプション	Sequence(シーケンス(テキスト))	(なし、なし)	ストリング
質問	シーケンス(テキスト)	（なし、）	ストリング

監視されたキー( as_supervised docを参照): None
図( tfds.show_examples ): サポートされていません。
引用：

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

race/high (デフォルト設定)

データセットのサイズ: 52.39 MiB
スプリット:

スプリット	例
`'dev'`	1,021
`'test'`	1,045
`'train'`	18,728

例( tfds.as_dataframe ):

レース/ミドル

データセットサイズ: 12.51 MiB
スプリット:

スプリット	例
`'dev'`	368
`'test'`	362
`'train'`	6,409

例( tfds.as_dataframe ):

人種 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

race/high (デフォルト設定)

レース/ミドル

人種