- বর্ণনা :
MSLR-WEB হল দুটি বড় মাপের লার্নিং-টু-র্যাঙ্ক ডেটাসেট যা মাইক্রোসফ্ট রিসার্চ দ্বারা প্রকাশিত হয়েছে। প্রথম ডেটাসেটে ("30k" বলা হয়) 30,000টি প্রশ্ন রয়েছে এবং দ্বিতীয় ডেটাসেটে ("10k" বলা হয়) 10,000টি প্রশ্ন রয়েছে৷ প্রতিটি ডেটাসেটে ক্যোয়ারী-ডকুমেন্ট জোড়া থাকে যা বৈশিষ্ট্য ভেক্টর এবং সংশ্লিষ্ট প্রাসঙ্গিক বিচার লেবেল হিসাবে উপস্থাপিত হয়।
আপনি ডেটাসেটের "10k" বা "30k" সংস্করণ এবং একটি সংশ্লিষ্ট ভাঁজ ব্যবহার করবেন কিনা তা উল্লেখ করতে পারেন:
ds = tfds.load("mslr_web/30k_fold1")
শুধুমাত্র mslr_web
নির্দিষ্ট করা থাকলে, mslr_web/10k_fold1
বিকল্পটি ডিফল্টরূপে নির্বাচিত হয়:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
হোমপেজ : https://www.microsoft.com/en-us/research/project/mslr/
সোর্স কোড :
tfds.ranking.mslr_web.MslrWeb
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
1.1.0
: বৈশিষ্ট্যগুলিকে একটি একক 'float_features' বৈশিষ্ট্যে বান্ডিল করুন৷ -
1.2.0
(ডিফল্ট): ক্যোয়ারী এবং নথি শনাক্তকারী যোগ করুন।
-
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বৈশিষ্ট্য গঠন :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
doc_id | টেনসর | (কোনটিই নয়,) | int64 | |
float_features | টেনসর | (কোনটিই নয়, 136) | float64 | |
লেবেল | টেনসর | (কোনটিই নয়,) | float64 | |
query_id | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (ডিফল্ট কনফিগারেশন)
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
310.08 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/10k_fold2
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
310.08 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/10k_fold3
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
310.08 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/10k_fold4
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
310.08 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/10k_fold5
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
310.08 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/30k_fold1
ডাউনলোড সাইজ :
3.59 GiB
ডেটাসেটের আকার :
964.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/30k_fold2
ডাউনলোড সাইজ :
3.59 GiB
ডেটাসেটের আকার :
964.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/30k_fold3
ডাউনলোড সাইজ :
3.59 GiB
ডেটাসেটের আকার :
964.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/30k_fold4
ডাউনলোড সাইজ :
3.59 GiB
ডেটাসেটের আকার :
964.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- উদাহরণ ( tfds.as_dataframe ):
mslr_web/30k_fold5
ডাউনলোড সাইজ :
3.59 GiB
ডেটাসেটের আকার :
964.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- উদাহরণ ( tfds.as_dataframe ):