- opis :
MSLR-WEB to dwa wielkoskalowe zestawy danych Learning-to-Rank wydane przez Microsoft Research. Pierwszy zestaw danych (o nazwie „30 000”) zawiera 30 000 zapytań, a drugi zestaw danych (o nazwie „10 000”) zawiera 10 000 zapytań. Każdy zestaw danych składa się z par zapytanie-dokument reprezentowanych jako wektory cech i odpowiadające im etykiety oceny istotności.
Możesz określić, czy chcesz użyć wersji zestawu danych „10 000” czy „30 000” i odpowiedniego zwinięcia w następujący sposób:
ds = tfds.load("mslr_web/30k_fold1")
Jeśli określono tylko mslr_web
, opcja mslr_web/10k_fold1
jest wybrana domyślnie:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Strona główna : https://www.microsoft.com/en-us/research/project/mslr/
Kod źródłowy :
tfds.ranking.mslr_web.MslrWeb
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.1.0
: Połącz funkcje w jedną funkcję „float_features”. -
1.2.0
(domyślnie): Dodaj identyfikatory zapytań i dokumentów.
-
Automatyczne buforowanie ( dokumentacja ): Nie
Struktura funkcji :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_dokumentu | Napinacz | (Nic,) | int64 | |
float_features | Napinacz | (Brak, 136) | pływak64 | |
etykieta | Napinacz | (Nic,) | pływak64 | |
identyfikator_zapytania | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (domyślna konfiguracja)
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
310.08 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/10k_fold2
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
310.08 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/10k_fold3
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
310.08 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/10k_fold4
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
310.08 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/10k_fold5
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
310.08 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/30k_fold1
Rozmiar pliku do pobrania :
3.59 GiB
Rozmiar zbioru danych :
964.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 6306 |
'train' | 18919 |
'vali' | 6306 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/30k_fold2
Rozmiar pliku do pobrania :
3.59 GiB
Rozmiar zbioru danych :
964.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 6307 |
'train' | 18918 |
'vali' | 6306 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/30k_fold3
Rozmiar pliku do pobrania :
3.59 GiB
Rozmiar zbioru danych :
964.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 6306 |
'train' | 18918 |
'vali' | 6307 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/30k_fold4
Rozmiar pliku do pobrania :
3.59 GiB
Rozmiar zbioru danych :
964.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 6306 |
'train' | 18919 |
'vali' | 6306 |
- Przykłady ( tfds.as_dataframe ):
mslr_web/30k_fold5
Rozmiar pliku do pobrania :
3.59 GiB
Rozmiar zbioru danych :
964.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 6306 |
'train' | 18919 |
'vali' | 6306 |
- Przykłady ( tfds.as_dataframe ):