mslr_web

  • বর্ণনা :

MSLR-WEB হল দুটি বড় মাপের লার্নিং-টু-র‍্যাঙ্ক ডেটাসেট যা মাইক্রোসফ্ট রিসার্চ দ্বারা প্রকাশিত হয়েছে। প্রথম ডেটাসেটে ("30k" বলা হয়) 30,000টি প্রশ্ন রয়েছে এবং দ্বিতীয় ডেটাসেটে ("10k" বলা হয়) 10,000টি প্রশ্ন রয়েছে৷ প্রতিটি ডেটাসেটে ক্যোয়ারী-ডকুমেন্ট জোড়া থাকে যা বৈশিষ্ট্য ভেক্টর এবং সংশ্লিষ্ট প্রাসঙ্গিক বিচার লেবেল হিসাবে উপস্থাপিত হয়।

আপনি ডেটাসেটের "10k" বা "30k" সংস্করণ এবং একটি সংশ্লিষ্ট ভাঁজ ব্যবহার করবেন কিনা তা উল্লেখ করতে পারেন:

ds = tfds.load("mslr_web/30k_fold1")

শুধুমাত্র mslr_web নির্দিষ্ট করা থাকলে, mslr_web/10k_fold1 বিকল্পটি ডিফল্টরূপে নির্বাচিত হয়:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
  • হোমপেজ : https://www.microsoft.com/en-us/research/project/mslr/

  • সোর্স কোড : tfds.ranking.mslr_web.MslrWeb

  • সংস্করণ :

    • 1.0.0 : প্রাথমিক প্রকাশ।
    • 1.1.0 : বৈশিষ্ট্যগুলিকে একটি একক 'float_features' বৈশিষ্ট্যে বান্ডিল করুন৷
    • 1.2.0 (ডিফল্ট): ক্যোয়ারী এবং নথি শনাক্তকারী যোগ করুন।
  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
doc_id টেনসর (কোনটিই নয়,) int64
float_features টেনসর (কোনটিই নয়, 136) float64
লেবেল টেনসর (কোনটিই নয়,) float64
query_id পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (ডিফল্ট কনফিগারেশন)

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 310.08 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold2

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 310.08 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold3

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 310.08 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold4

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 310.08 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold5

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 310.08 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/30k_fold1

  • ডাউনলোড সাইজ : 3.59 GiB

  • ডেটাসেটের আকার : 964.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold2

  • ডাউনলোড সাইজ : 3.59 GiB

  • ডেটাসেটের আকার : 964.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,307
'train' 18,918
'vali' 6,306

mslr_web/30k_fold3

  • ডাউনলোড সাইজ : 3.59 GiB

  • ডেটাসেটের আকার : 964.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,306
'train' 18,918
'vali' 6,307

mslr_web/30k_fold4

  • ডাউনলোড সাইজ : 3.59 GiB

  • ডেটাসেটের আকার : 964.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold5

  • ডাউনলোড সাইজ : 3.59 GiB

  • ডেটাসেটের আকার : 964.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,306
'train' 18,919
'vali' 6,306