sci_tail
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
SciTail データセットは、多肢選択式の科学試験と Web 文から作成された含意データセットです。各質問と正解の選択は、仮説を形成するための断定的なステートメントに変換されます。 Web 文の大規模なテキスト コーパスから情報検索を使用して関連するテキストを取得し、これらの文を前提 P として使用します。このような前提と仮説のペアの注釈は、サポートする (含意) またはサポートしない (ニュートラル) としてクラウドソーシングされます。 SciTail データセットを作成します。データセットには 27,026 の例が含まれており、そのうち 10,101 の例が含意ラベル付きで、16,925 の例が中立ラベル付きです。
スプリット | 例 |
---|
'test' | 2,126 |
'train' | 23,097 |
'validation' | 1,304 |
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
特徴 | クラス | 形 | Dtype | 説明 |
---|
| 特徴辞書 | | | |
仮説 | 文章 | | ストリング | |
ラベル | クラスラベル | | int64 | |
前提 | 文章 | | ストリング | |
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2022-12-23 UTC。
[null,null,["最終更新日 2022-12-23 UTC。"],[],[],null,["# sci_tail\n\n\u003cbr /\u003e\n\n- **Description**:\n\nThe SciTail dataset is an entailment dataset created from multiple-choice\nscience exams and web sentences. Each question and the correct answer choice are\nconverted into an assertive statement to form the hypothesis. Information\nretrieval is used to obtain relevant text from a large text corpus of web\nsentences, and these sentences are used as a premise P. The annotation of such\npremise-hypothesis pair is crowdsourced as supports (entails) or not (neutral),\nin order to create the SciTail dataset. The dataset contains 27,026 examples\nwith 10,101 examples with entails label and 16,925 examples with neutral label.\n\n- **Additional Documentation** :\n [Explore on Papers With Code\n north_east](https://paperswithcode.com/dataset/scitail)\n\n- **Homepage** :\n \u003chttps://allenai.org/data/scitail\u003e\n\n- **Source code** :\n [`tfds.datasets.sci_tail.Builder`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/datasets/sci_tail/sci_tail_dataset_builder.py)\n\n- **Versions**:\n\n - **`1.0.0`** (default): Initial release.\n- **Download size** : `13.52 MiB`\n\n- **Dataset size** : `6.01 MiB`\n\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n Yes\n\n- **Splits**:\n\n| Split | Examples |\n|----------------|----------|\n| `'test'` | 2,126 |\n| `'train'` | 23,097 |\n| `'validation'` | 1,304 |\n\n- **Feature structure**:\n\n FeaturesDict({\n 'hypothesis': Text(shape=(), dtype=string),\n 'label': ClassLabel(shape=(), dtype=int64, num_classes=2),\n 'premise': Text(shape=(), dtype=string),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|------------|--------------|-------|--------|-------------|\n| | FeaturesDict | | | |\n| hypothesis | Text | | string | |\n| label | ClassLabel | | int64 | |\n| premise | Text | | string | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Examples**\n ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\n- **Citation**:\n\n @inproceedings{khot2018scitail,\n title={Scitail: A textual entailment dataset from science question answering},\n author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},\n booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},\n url = \"http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf\",\n year={2018}\n }"]]