- תיאור :
MSLR-WEB הם שני מערכי נתונים בקנה מידה גדול של למידה לדירוג שפורסמו על ידי Microsoft Research. מערך הנתונים הראשון (הנקרא "30k") מכיל 30,000 שאילתות ומערך הנתונים השני (הנקרא "10k") מכיל 10,000 שאילתות. כל מערך נתונים מורכב מזוגות שאילתה-מסמכים המיוצגים כווקטורים של תכונה ותוויות שיפוט מתאימות של רלוונטיות.
אתה יכול לציין אם להשתמש בגרסת "10k" או "30k" של מערך הנתונים, ובקיפול מתאים, באופן הבא:
ds = tfds.load("mslr_web/30k_fold1")
אם מצוין רק mslr_web
, האפשרות mslr_web/10k_fold1
נבחרה כברירת מחדל:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
דף הבית : https://www.microsoft.com/en-us/research/project/mslr/
קוד מקור :
tfds.ranking.mslr_web.MslrWeb
גרסאות :
-
1.0.0
: שחרור ראשוני. -
1.1.0
: צרור תכונות לתכונה אחת של 'float_features'. -
1.2.0
(ברירת מחדל): הוסף מזהי שאילתה ומזהי מסמכים.
-
שמירה אוטומטית במטמון ( תיעוד ): לא
מבנה תכונה :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
doc_id | מוֹתֵחַ | (אף אחד,) | int64 | |
לצוף_תכונות | מוֹתֵחַ | (אין, 136) | לצוף64 | |
תווית | מוֹתֵחַ | (אף אחד,) | לצוף64 | |
query_id | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (תצורת ברירת המחדל)
גודל הורדה :
1.15 GiB
גודל ערכת נתונים:
310.08 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/10k_fold2
גודל הורדה :
1.15 GiB
גודל ערכת נתונים:
310.08 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/10k_fold3
גודל הורדה :
1.15 GiB
גודל ערכת נתונים:
310.08 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/10k_fold4
גודל הורדה :
1.15 GiB
גודל ערכת נתונים:
310.08 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/10k_fold5
גודל הורדה :
1.15 GiB
גודל ערכת נתונים:
310.08 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/30k_fold1
גודל הורדה :
3.59 GiB
גודל ערכת נתונים:
964.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/30k_fold2
גודל הורדה :
3.59 GiB
גודל ערכת נתונים:
964.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/30k_fold3
גודל הורדה :
3.59 GiB
גודל ערכת נתונים:
964.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/30k_fold4
גודל הורדה :
3.59 GiB
גודל ערכת נתונים:
964.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- דוגמאות ( tfds.as_dataframe ):
mslr_web/30k_fold5
גודל הורדה :
3.59 GiB
גודל ערכת נתונים:
964.09 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- דוגמאות ( tfds.as_dataframe ):