yahoo_ltrc

  • বর্ণনা :

ইয়াহু লার্নিং টু র‍্যাঙ্ক চ্যালেঞ্জ ডেটাসেট (যাকে "C14"ও বলা হয়) ইয়াহু দ্বারা প্রকাশিত একটি লার্নিং-টু-র‍্যাঙ্ক ডেটাসেট। ডেটাসেটে ক্যোয়ারী-ডকুমেন্ট জোড়া থাকে যা বৈশিষ্ট্য ভেক্টর এবং সংশ্লিষ্ট প্রাসঙ্গিকতা বিচার লেবেল হিসাবে উপস্থাপিত হয়।

ডেটাসেটে দুটি সংস্করণ রয়েছে:

  • সেট1 : set1 টি ক্যোয়ারী-ডকুমেন্ট জোড়া রয়েছে।
  • সেট2 : set2 টি ক্যোয়ারী-ডকুমেন্ট জোড়া রয়েছে।

আপনি set1 1 বা set2 2 সংস্করণ ব্যবহার করবেন কিনা তা নিম্নরূপ উল্লেখ করতে পারেন:

ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")

শুধুমাত্র yahoo_ltrc নির্দিষ্ট করা থাকলে, yahoo_ltrc/set1 বিকল্পটি ডিফল্টরূপে নির্বাচিত হয়:

# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
  • হোমপেজ : https://research.yahoo.com/datasets

  • সোর্স কোড : tfds.ranking.yahoo_ltrc.YahooLTRC

  • সংস্করণ :

    • 1.0.0 : প্রাথমিক প্রকাশ।
    • 1.1.0 (ডিফল্ট): ক্যোয়ারী এবং নথি শনাক্তকারী যোগ করুন।
  • ডাউনলোড আকার : Unknown size

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
    https://research.yahoo.com/datasets- এ C14 Yahoo Learning To Rank Challenge ডেটাসেটের অ্যাক্সেসের জন্য অনুরোধ করুন ডাউনলোড করা dataset.tgz ফাইলটি বের করুন এবং ltrc_yahoo.tar.bz2 ফাইলটি manual_dir/ এ রাখুন।

  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@inproceedings{chapelle2011yahoo,
  title={Yahoo! learning to rank challenge overview},
  author={Chapelle, Olivier and Chang, Yi},
  booktitle={Proceedings of the learning to rank challenge},
  pages={1--24},
  year={2011},
  organization={PMLR}
}

yahoo_ltrc/set1 (ডিফল্ট কনফিগারেশন)

  • ডেটাসেটের আকার : 795.39 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 6,983
'train' 19,944
'vali' 2,994
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 699), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
doc_id টেনসর (কোনটিই নয়,) int64
float_features টেনসর (কোনটিই নয়, 699) float64
লেবেল টেনসর (কোনটিই নয়,) float64
query_id পাঠ্য স্ট্রিং

yahoo_ltrc/set2

  • ডেটাসেটের আকার : 194.92 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৩,৭৯৮
'train' 1,266
'vali' 1,266
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 700), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
doc_id টেনসর (কোনটিই নয়,) int64
float_features টেনসর (কোনটি নয়, 700) float64
লেবেল টেনসর (কোনটিই নয়,) float64
query_id পাঠ্য স্ট্রিং