- توضیحات :
MSLR-WEB دو مجموعه داده یادگیری به رتبه در مقیاس بزرگ هستند که توسط Microsoft Research منتشر شده اند. مجموعه داده اول (به نام "30k") شامل 30000 پرس و جو و مجموعه داده دوم (به نام "10k") شامل 10000 پرس و جو است. هر مجموعه داده شامل جفتهای پرس و جو-سند است که بهعنوان بردارهای ویژگی و برچسبهای قضاوت مربوطه نشان داده میشوند.
شما می توانید تعیین کنید که آیا از نسخه "10k" یا "30k" مجموعه داده و یک فولد مربوطه استفاده شود، به صورت زیر:
ds = tfds.load("mslr_web/30k_fold1")
اگر فقط mslr_web
مشخص شده باشد، گزینه mslr_web/10k_fold1
به طور پیش فرض انتخاب می شود:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
صفحه اصلی : https://www.microsoft.com/en-us/research/project/mslr/
کد منبع :
tfds.ranking.mslr_web.MslrWeb
نسخه ها :
-
1.0.0
: انتشار اولیه. -
1.1.0
: ویژگی ها را در یک ویژگی «float_features» دسته بندی کنید. -
1.2.0
(پیش فرض): شناسه های پرس و جو و سند را اضافه کنید.
-
ذخیره خودکار ( اسناد ): خیر
ساختار ویژگی :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
doc_id | تانسور | (هیچ یک،) | int64 | |
float_features | تانسور | (هیچ، 136) | float64 | |
برچسب | تانسور | (هیچ یک،) | float64 | |
query_id | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (پیکربندی پیشفرض)
حجم دانلود :
1.15 GiB
حجم مجموعه داده :
310.08 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- مثالها ( tfds.as_dataframe ):
mslr_web/10k_fold2
حجم دانلود :
1.15 GiB
حجم مجموعه داده :
310.08 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- مثالها ( tfds.as_dataframe ):
mslr_web/10k_fold3
حجم دانلود :
1.15 GiB
حجم مجموعه داده :
310.08 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- مثالها ( tfds.as_dataframe ):
mslr_web/10k_fold4
حجم دانلود :
1.15 GiB
حجم مجموعه داده :
310.08 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- مثالها ( tfds.as_dataframe ):
mslr_web/10k_fold5
حجم دانلود :
1.15 GiB
حجم مجموعه داده :
310.08 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- مثالها ( tfds.as_dataframe ):
mslr_web/30k_fold1
حجم دانلود :
3.59 GiB
حجم مجموعه داده :
964.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 6,306 |
'train' | 18919 |
'vali' | 6,306 |
- مثالها ( tfds.as_dataframe ):
mslr_web/30k_fold2
حجم دانلود :
3.59 GiB
حجم مجموعه داده :
964.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 6,307 |
'train' | 18918 |
'vali' | 6,306 |
- مثالها ( tfds.as_dataframe ):
mslr_web/30k_fold3
حجم دانلود :
3.59 GiB
حجم مجموعه داده :
964.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 6,306 |
'train' | 18918 |
'vali' | 6,307 |
- مثالها ( tfds.as_dataframe ):
mslr_web/30k_fold4
حجم دانلود :
3.59 GiB
حجم مجموعه داده :
964.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 6,306 |
'train' | 18919 |
'vali' | 6,306 |
- مثالها ( tfds.as_dataframe ):
mslr_web/30k_fold5
حجم دانلود :
3.59 GiB
حجم مجموعه داده :
964.09 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 6,306 |
'train' | 18919 |
'vali' | 6,306 |
- مثالها ( tfds.as_dataframe ):