- Açıklama :
MSLR-WEB, Microsoft Research tarafından yayımlanan iki büyük ölçekli Sıralamaya Göre Öğrenme veri kümesidir. İlk veri seti ("30k" olarak adlandırılır) 30.000 sorgu içerir ve ikinci veri seti ("10k" olarak adlandırılır) 10.000 sorgu içerir. Her veri kümesi, özellik vektörleri ve karşılık gelen alaka değerlendirme etiketleri olarak temsil edilen sorgu-belge çiftlerinden oluşur.
Veri kümesinin "10k" veya "30k" versiyonunun kullanılıp kullanılmayacağını ve buna karşılık gelen bir katlamayı aşağıdaki gibi belirtebilirsiniz:
ds = tfds.load("mslr_web/30k_fold1")
Yalnızca mslr_web
belirtilirse, varsayılan olarak mslr_web/10k_fold1
seçeneği seçilir:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Ana Sayfa : https://www.microsoft.com/en-us/research/project/mslr/
Kaynak kodu :
tfds.ranking.mslr_web.MslrWeb
sürümler :
-
1.0.0
: İlk sürüm. -
1.1.0
: Özellikleri tek bir 'float_features' özelliğinde toplayın. -
1.2.0
(varsayılan): Sorgu ve belge tanımlayıcıları ekleyin.
-
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
Özellik yapısı :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
doc_id | tensör | (Hiçbiri,) | int64 | |
float_features | tensör | (Yok, 136) | şamandıra64 | |
etiket | tensör | (Hiçbiri,) | şamandıra64 | |
sorgu_kimliği | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (varsayılan yapılandırma)
İndirme boyutu :
1.15 GiB
Veri kümesi boyutu :
310.08 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/10k_fold2
İndirme boyutu :
1.15 GiB
Veri kümesi boyutu :
310.08 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/10k_fold3
İndirme boyutu :
1.15 GiB
Veri kümesi boyutu :
310.08 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/10k_fold4
İndirme boyutu :
1.15 GiB
Veri kümesi boyutu :
310.08 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/10k_fold5
İndirme boyutu :
1.15 GiB
Veri kümesi boyutu :
310.08 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/30k_fold1
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
964.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/30k_fold2
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
964.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.307 |
'train' | 18.918 |
'vali' | 6.306 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/30k_fold3
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
964.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.306 |
'train' | 18.918 |
'vali' | 6.307 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/30k_fold4
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
964.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Örnekler ( tfds.as_dataframe ):
mslr_web/30k_fold5
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
964.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Örnekler ( tfds.as_dataframe ):