- Descripción :
MSLR-WEB son dos conjuntos de datos de aprendizaje para clasificar a gran escala publicados por Microsoft Research. El primer conjunto de datos (llamado "30k") contiene 30 000 consultas y el segundo conjunto de datos (llamado "10k") contiene 10 000 consultas. Cada conjunto de datos consta de pares de consulta-documento representados como vectores de características y etiquetas de juicio de relevancia correspondientes.
Puede especificar si desea usar la versión "10k" o "30k" del conjunto de datos y el pliegue correspondiente, de la siguiente manera:
ds = tfds.load("mslr_web/30k_fold1")
Si solo se especifica mslr_web
, la opción mslr_web/10k_fold1
se selecciona de manera predeterminada:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Página de inicio: https://www.microsoft.com/en-us/research/project/mslr/
Código fuente :
tfds.ranking.mslr_web.MslrWeb
Versiones :
-
1.0.0
: Versión inicial. -
1.1.0
: Agrupe funciones en una sola función 'float_features'. -
1.2.0
(predeterminado): agregue identificadores de consultas y documentos.
-
Almacenamiento automático en caché ( documentación ): No
Estructura de características :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
ID_doc | Tensor | (Ninguno,) | int64 | |
funciones_flotantes | Tensor | (Ninguno, 136) | flotar64 | |
etiqueta | Tensor | (Ninguno,) | flotar64 | |
consulta_id | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (configuración predeterminada)
Tamaño de descarga :
1.15 GiB
Tamaño del conjunto de datos :
310.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/10k_fold2
Tamaño de descarga :
1.15 GiB
Tamaño del conjunto de datos :
310.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/10k_fold3
Tamaño de descarga :
1.15 GiB
Tamaño del conjunto de datos :
310.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/10k_fold4
Tamaño de descarga :
1.15 GiB
Tamaño del conjunto de datos :
310.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/10k_fold5
Tamaño de descarga :
1.15 GiB
Tamaño del conjunto de datos :
310.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/30k_fold1
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
964.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/30k_fold2
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
964.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/30k_fold3
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
964.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/30k_fold4
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
964.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ejemplos ( tfds.as_dataframe ):
mslr_web/30k_fold5
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
964.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ejemplos ( tfds.as_dataframe ):