mslr_web
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
MSLR-WEB は、Microsoft Research によってリリースされた 2 つの大規模な Learning-to-Rank データセットです。最初のデータセット (「30k」と呼ばれる) には 30,000 のクエリが含まれ、2 番目のデータセット (「10k」と呼ばれる) には 10,000 のクエリが含まれます。各データセットは、特徴ベクトルとして表されるクエリとドキュメントのペアと、対応する関連性判断ラベルで構成されます。
データセットの「10k」または「30k」バージョンを使用するかどうか、および対応するフォールドを次のように指定できます。
ds = tfds.load("mslr_web/30k_fold1")
mslr_web
のみが指定されている場合、デフォルトでmslr_web/10k_fold1
オプションが選択されます。
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
特徴 | クラス | 形 | Dtype | 説明 |
---|
| 特徴辞書 | | | |
doc_id | テンソル | (なし、) | int64 | |
float_features | テンソル | (なし、136) | float64 | |
ラベル | テンソル | (なし、) | float64 | |
query_id | 文章 | | ストリング | |
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (デフォルト設定)
ダウンロードサイズ: 1.15 GiB
データセットのサイズ: 310.08 MiB
スプリット:
スプリット | 例 |
---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
mslr_web/10k_fold2
ダウンロードサイズ: 1.15 GiB
データセットのサイズ: 310.08 MiB
スプリット:
スプリット | 例 |
---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
mslr_web/10k_fold3
ダウンロードサイズ: 1.15 GiB
データセットのサイズ: 310.08 MiB
スプリット:
スプリット | 例 |
---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
mslr_web/10k_fold4
ダウンロードサイズ: 1.15 GiB
データセットのサイズ: 310.08 MiB
スプリット:
スプリット | 例 |
---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
mslr_web/10k_fold5
ダウンロードサイズ: 1.15 GiB
データセットのサイズ: 310.08 MiB
スプリット:
スプリット | 例 |
---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
mslr_web/30k_fold1
ダウンロードサイズ: 3.59 GiB
データセットサイズ: 964.09 MiB
スプリット:
スプリット | 例 |
---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
mslr_web/30k_fold2
ダウンロードサイズ: 3.59 GiB
データセットサイズ: 964.09 MiB
スプリット:
スプリット | 例 |
---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
mslr_web/30k_fold3
ダウンロードサイズ: 3.59 GiB
データセットサイズ: 964.09 MiB
スプリット:
スプリット | 例 |
---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
mslr_web/30k_fold4
ダウンロードサイズ: 3.59 GiB
データセットサイズ: 964.09 MiB
スプリット:
スプリット | 例 |
---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
mslr_web/30k_fold5
ダウンロードサイズ: 3.59 GiB
データセットサイズ: 964.09 MiB
スプリット:
スプリット | 例 |
---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2023-01-19 UTC。
[null,null,["最終更新日 2023-01-19 UTC。"],[],[],null,["# mslr_web\n\n\u003cbr /\u003e\n\n- **Description**:\n\nMSLR-WEB are two large-scale Learning-to-Rank datasets released by Microsoft\nResearch. The first dataset (called \"30k\") contains 30,000 queries and the\nsecond dataset (called \"10k\") contains 10,000 queries. Each dataset consists of\nquery-document pairs represented as feature vectors and corresponding relevance\njudgment labels.\n\nYou can specify whether to use the \"10k\" or \"30k\" version of the dataset, and a\ncorresponding fold, as follows: \n\n ds = tfds.load(\"mslr_web/30k_fold1\")\n\nIf only `mslr_web` is specified, the `mslr_web/10k_fold1` option is selected by\ndefault: \n\n # This is the same as `tfds.load(\"mslr_web/10k_fold1\")`\n ds = tfds.load(\"mslr_web\")\n\n- **Homepage** :\n \u003chttps://www.microsoft.com/en-us/research/project/mslr/\u003e\n\n- **Source code** :\n [`tfds.ranking.mslr_web.MslrWeb`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/ranking/mslr_web/mslr_web.py)\n\n- **Versions**:\n\n - `1.0.0`: Initial release.\n - `1.1.0`: Bundle features into a single 'float_features' feature.\n - **`1.2.0`** (default): Add query and document identifiers.\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n No\n\n- **Feature structure**:\n\n FeaturesDict({\n 'doc_id': Tensor(shape=(None,), dtype=int64),\n 'float_features': Tensor(shape=(None, 136), dtype=float64),\n 'label': Tensor(shape=(None,), dtype=float64),\n 'query_id': Text(shape=(), dtype=string),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|----------------|--------------|-------------|---------|-------------|\n| | FeaturesDict | | | |\n| doc_id | Tensor | (None,) | int64 | |\n| float_features | Tensor | (None, 136) | float64 | |\n| label | Tensor | (None,) | float64 | |\n| query_id | Text | | string | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Citation**:\n\n @article{DBLP:journals/corr/QinL13,\n author = {Tao Qin and Tie{-}Yan Liu},\n title = {Introducing {LETOR} 4.0 Datasets},\n journal = {CoRR},\n volume = {abs/1306.2597},\n year = {2013},\n url = {http://arxiv.org/abs/1306.2597},\n timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},\n biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},\n bibsource = {dblp computer science bibliography, http://dblp.org}\n }\n\nmslr_web/10k_fold1 (default config)\n-----------------------------------\n\n- **Download size** : `1.15 GiB`\n\n- **Dataset size** : `310.08 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 2,000 |\n| `'train'` | 6,000 |\n| `'vali'` | 2,000 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/10k_fold2\n------------------\n\n- **Download size** : `1.15 GiB`\n\n- **Dataset size** : `310.08 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 2,000 |\n| `'train'` | 6,000 |\n| `'vali'` | 2,000 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/10k_fold3\n------------------\n\n- **Download size** : `1.15 GiB`\n\n- **Dataset size** : `310.08 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 2,000 |\n| `'train'` | 6,000 |\n| `'vali'` | 2,000 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/10k_fold4\n------------------\n\n- **Download size** : `1.15 GiB`\n\n- **Dataset size** : `310.08 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 2,000 |\n| `'train'` | 6,000 |\n| `'vali'` | 2,000 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/10k_fold5\n------------------\n\n- **Download size** : `1.15 GiB`\n\n- **Dataset size** : `310.08 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 2,000 |\n| `'train'` | 6,000 |\n| `'vali'` | 2,000 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/30k_fold1\n------------------\n\n- **Download size** : `3.59 GiB`\n\n- **Dataset size** : `964.09 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 6,306 |\n| `'train'` | 18,919 |\n| `'vali'` | 6,306 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/30k_fold2\n------------------\n\n- **Download size** : `3.59 GiB`\n\n- **Dataset size** : `964.09 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 6,307 |\n| `'train'` | 18,918 |\n| `'vali'` | 6,306 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/30k_fold3\n------------------\n\n- **Download size** : `3.59 GiB`\n\n- **Dataset size** : `964.09 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 6,306 |\n| `'train'` | 18,918 |\n| `'vali'` | 6,307 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/30k_fold4\n------------------\n\n- **Download size** : `3.59 GiB`\n\n- **Dataset size** : `964.09 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 6,306 |\n| `'train'` | 18,919 |\n| `'vali'` | 6,306 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nmslr_web/30k_fold5\n------------------\n\n- **Download size** : `3.59 GiB`\n\n- **Dataset size** : `964.09 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|-----------|----------|\n| `'test'` | 6,306 |\n| `'train'` | 18,919 |\n| `'vali'` | 6,306 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples..."]]