mslr_web

  • الوصف :

MSLR-WEB هما مجموعتان من بيانات التعلم للترتيب واسع النطاق تم إصدارهما بواسطة Microsoft Research. تحتوي مجموعة البيانات الأولى (المسماة "30 كيلو") على 30000 استعلام ومجموعة البيانات الثانية (تسمى "10 كيلو") تحتوي على 10000 استعلام. تتكون كل مجموعة بيانات من أزواج من مستندات الاستعلام ممثلة كمتجهات ميزات وما يقابلها من تسميات حكم ذات صلة.

يمكنك تحديد ما إذا كنت تريد استخدام الإصدار "10 كيلو بايت" أو "30 كيلو بايت" من مجموعة البيانات ، والطي المقابل ، على النحو التالي:

ds = tfds.load("mslr_web/30k_fold1")

إذا تم تحديد mslr_web فقط ، فسيتم تحديد الخيار mslr_web/10k_fold1 افتراضيًا:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
doc_id موتر (لا أحد،) int64
تعويم_ميزات موتر (لا شيء ، 136) تعويم 64
ضع الكلمة المناسبة موتر (لا أحد،) تعويم 64
معرّف_ الاستعلام نص سلسلة
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web / 10k_fold1 (التكوين الافتراضي)

  • حجم التحميل : 1.15 GiB

  • حجم مجموعة البيانات : 310.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000
'train' 6000
'vali' 2000

mslr_web / 10k_fold2

  • حجم التحميل : 1.15 GiB

  • حجم مجموعة البيانات : 310.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000
'train' 6000
'vali' 2000

mslr_web / 10k_fold3

  • حجم التحميل : 1.15 GiB

  • حجم مجموعة البيانات : 310.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000
'train' 6000
'vali' 2000

mslr_web / 10k_fold4

  • حجم التحميل : 1.15 GiB

  • حجم مجموعة البيانات : 310.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000
'train' 6000
'vali' 2000

mslr_web / 10k_fold5

  • حجم التحميل : 1.15 GiB

  • حجم مجموعة البيانات : 310.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000
'train' 6000
'vali' 2000

mslr_web / 30k_fold1

  • حجم التحميل : 3.59 GiB

  • حجم مجموعة البيانات : 964.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 6306
'train' 18،919
'vali' 6306

mslr_web / 30k_fold2

  • حجم التحميل : 3.59 GiB

  • حجم مجموعة البيانات : 964.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 6307
'train' 18،918
'vali' 6306

mslr_web / 30k_fold3

  • حجم التحميل : 3.59 GiB

  • حجم مجموعة البيانات : 964.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 6306
'train' 18،918
'vali' 6307

mslr_web / 30k_fold4

  • حجم التحميل : 3.59 GiB

  • حجم مجموعة البيانات : 964.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 6306
'train' 18،919
'vali' 6306

mslr_web / 30k_fold5

  • حجم التحميل : 3.59 GiB

  • حجم مجموعة البيانات : 964.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 6306
'train' 18،919
'vali' 6306