mslr_web

  • Açıklama :

MSLR-WEB, Microsoft Research tarafından yayımlanan iki büyük ölçekli Sıralamaya Göre Öğrenme veri kümesidir. İlk veri seti ("30k" olarak adlandırılır) 30.000 sorgu içerir ve ikinci veri seti ("10k" olarak adlandırılır) 10.000 sorgu içerir. Her veri kümesi, özellik vektörleri ve karşılık gelen alaka değerlendirme etiketleri olarak temsil edilen sorgu-belge çiftlerinden oluşur.

Veri kümesinin "10k" veya "30k" versiyonunun kullanılıp kullanılmayacağını ve buna karşılık gelen bir katlamayı aşağıdaki gibi belirtebilirsiniz:

ds = tfds.load("mslr_web/30k_fold1")

Yalnızca mslr_web belirtilirse, varsayılan olarak mslr_web/10k_fold1 seçeneği seçilir:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
doc_id tensör (Hiçbiri,) int64
float_features tensör (Yok, 136) şamandıra64
etiket tensör (Hiçbiri,) şamandıra64
sorgu_kimliği Metin sicim
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (varsayılan yapılandırma)

  • İndirme boyutu : 1.15 GiB

  • Veri kümesi boyutu : 310.08 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold2

  • İndirme boyutu : 1.15 GiB

  • Veri kümesi boyutu : 310.08 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold3

  • İndirme boyutu : 1.15 GiB

  • Veri kümesi boyutu : 310.08 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold4

  • İndirme boyutu : 1.15 GiB

  • Veri kümesi boyutu : 310.08 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold5

  • İndirme boyutu : 1.15 GiB

  • Veri kümesi boyutu : 310.08 MiB

  • bölmeler :

Bölmek örnekler
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/30k_fold1

  • İndirme boyutu : 3.59 GiB

  • Veri kümesi boyutu : 964.09 MiB

  • bölmeler :

Bölmek örnekler
'test' 6.306
'train' 18.919
'vali' 6.306

mslr_web/30k_fold2

  • İndirme boyutu : 3.59 GiB

  • Veri kümesi boyutu : 964.09 MiB

  • bölmeler :

Bölmek örnekler
'test' 6.307
'train' 18.918
'vali' 6.306

mslr_web/30k_fold3

  • İndirme boyutu : 3.59 GiB

  • Veri kümesi boyutu : 964.09 MiB

  • bölmeler :

Bölmek örnekler
'test' 6.306
'train' 18.918
'vali' 6.307

mslr_web/30k_fold4

  • İndirme boyutu : 3.59 GiB

  • Veri kümesi boyutu : 964.09 MiB

  • bölmeler :

Bölmek örnekler
'test' 6.306
'train' 18.919
'vali' 6.306

mslr_web/30k_fold5

  • İndirme boyutu : 3.59 GiB

  • Veri kümesi boyutu : 964.09 MiB

  • bölmeler :

Bölmek örnekler
'test' 6.306
'train' 18.919
'vali' 6.306