mslr_web

  • תיאור :

MSLR-WEB הם שני מערכי נתונים בקנה מידה גדול של למידה לדירוג שפורסמו על ידי Microsoft Research. מערך הנתונים הראשון (הנקרא "30k") מכיל 30,000 שאילתות ומערך הנתונים השני (הנקרא "10k") מכיל 10,000 שאילתות. כל מערך נתונים מורכב מזוגות שאילתה-מסמכים המיוצגים כווקטורים של תכונה ותוויות שיפוט מתאימות של רלוונטיות.

אתה יכול לציין אם להשתמש בגרסת "10k" או "30k" של מערך הנתונים, ובקיפול מתאים, באופן הבא:

ds = tfds.load("mslr_web/30k_fold1")

אם מצוין רק mslr_web , האפשרות mslr_web/10k_fold1 נבחרה כברירת מחדל:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
doc_id מוֹתֵחַ (אף אחד,) int64
לצוף_תכונות מוֹתֵחַ (אין, 136) לצוף64
תווית מוֹתֵחַ (אף אחד,) לצוף64
query_id טֶקסט חוּט
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (תצורת ברירת המחדל)

  • גודל הורדה : 1.15 GiB

  • גודל ערכת נתונים: 310.08 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold2

  • גודל הורדה : 1.15 GiB

  • גודל ערכת נתונים: 310.08 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold3

  • גודל הורדה : 1.15 GiB

  • גודל ערכת נתונים: 310.08 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold4

  • גודל הורדה : 1.15 GiB

  • גודל ערכת נתונים: 310.08 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold5

  • גודל הורדה : 1.15 GiB

  • גודל ערכת נתונים: 310.08 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/30k_fold1

  • גודל הורדה : 3.59 GiB

  • גודל ערכת נתונים: 964.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold2

  • גודל הורדה : 3.59 GiB

  • גודל ערכת נתונים: 964.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,307
'train' 18,918
'vali' 6,306

mslr_web/30k_fold3

  • גודל הורדה : 3.59 GiB

  • גודל ערכת נתונים: 964.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,306
'train' 18,918
'vali' 6,307

mslr_web/30k_fold4

  • גודל הורדה : 3.59 GiB

  • גודל ערכת נתונים: 964.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold5

  • גודל הורדה : 3.59 GiB

  • גודל ערכת נתונים: 964.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,306
'train' 18,919
'vali' 6,306