- 説明:
Stanford Question Answering Dataset (SQuAD) は、ウィキペディアの一連の記事に対してクラウドワーカーによって提起された質問で構成される読解力のデータセットです。すべての質問に対する回答は、対応する読書の一節または質問からのテキストのセグメントまたはスパンです。答えられないかもしれません。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.squad.Builder
バージョン:
-
3.0.0
(デフォルト): 少数の例 (19) で、コンテキストの空白の削除により回答範囲がずれている問題を修正します。
-
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{2016arXiv160605250R,
author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
Konstantin and {Liang}, Percy},
title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
journal = {arXiv e-prints},
year = 2016,
eid = {arXiv:1606.05250},
pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
eprint = {1606.05250},
}
分隊/v1.1 (デフォルト設定)
構成の説明: SQUAD のバージョン 1.1.0
ダウンロードサイズ:
33.51 MiB
データセットサイズ:
94.06 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'train' | 87,599 |
'validation' | 10,570 |
- 機能構造:
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
答え | 順序 | |||
回答/answer_start | テンソル | int32 | ||
回答/テキスト | 文章 | ストリング | ||
環境 | 文章 | ストリング | ||
ID | テンソル | ストリング | ||
質問 | 文章 | ストリング | ||
題名 | 文章 | ストリング |
- 例( tfds.as_dataframe ):
分隊/v2.0
構成の説明: SQUAD のバージョン 2.0.0
ダウンロードサイズ:
44.34 MiB
データセットのサイズ:
148.54 MiB
自動キャッシュ(ドキュメント): はい (検証)、
shuffle_files=False
の場合のみ (トレーニング)スプリット:
スプリット | 例 |
---|---|
'train' | 130,319 |
'validation' | 11,873 |
- 機能構造:
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'is_impossible': bool,
'plausible_answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
答え | 順序 | |||
回答/answer_start | テンソル | int32 | ||
回答/テキスト | 文章 | ストリング | ||
環境 | 文章 | ストリング | ||
ID | テンソル | ストリング | ||
不可能です | テンソル | ブール | ||
plausible_answers | 順序 | |||
plausible_answers/answer_start | テンソル | int32 | ||
もっともらしい回答/テキスト | 文章 | ストリング | ||
質問 | 文章 | ストリング | ||
題名 | 文章 | ストリング |
- 例( tfds.as_dataframe ):