mslr_web

  • Descripción :

MSLR-WEB son dos conjuntos de datos de aprendizaje para clasificar a gran escala publicados por Microsoft Research. El primer conjunto de datos (llamado "30k") contiene 30 000 consultas y el segundo conjunto de datos (llamado "10k") contiene 10 000 consultas. Cada conjunto de datos consta de pares de consulta-documento representados como vectores de características y etiquetas de juicio de relevancia correspondientes.

Puede especificar si desea usar la versión "10k" o "30k" del conjunto de datos y el pliegue correspondiente, de la siguiente manera:

ds = tfds.load("mslr_web/30k_fold1")

Si solo se especifica mslr_web , la opción mslr_web/10k_fold1 se selecciona de manera predeterminada:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
ID_doc Tensor (Ninguno,) int64
funciones_flotantes Tensor (Ninguno, 136) flotar64
etiqueta Tensor (Ninguno,) flotar64
consulta_id Texto cuerda
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (configuración predeterminada)

  • Tamaño de descarga : 1.15 GiB

  • Tamaño del conjunto de datos : 310.08 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold2

  • Tamaño de descarga : 1.15 GiB

  • Tamaño del conjunto de datos : 310.08 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold3

  • Tamaño de descarga : 1.15 GiB

  • Tamaño del conjunto de datos : 310.08 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold4

  • Tamaño de descarga : 1.15 GiB

  • Tamaño del conjunto de datos : 310.08 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold5

  • Tamaño de descarga : 1.15 GiB

  • Tamaño del conjunto de datos : 310.08 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/30k_fold1

  • Tamaño de descarga : 3.59 GiB

  • Tamaño del conjunto de datos : 964.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold2

  • Tamaño de descarga : 3.59 GiB

  • Tamaño del conjunto de datos : 964.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 6,307
'train' 18,918
'vali' 6,306

mslr_web/30k_fold3

  • Tamaño de descarga : 3.59 GiB

  • Tamaño del conjunto de datos : 964.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 6,306
'train' 18,918
'vali' 6,307

mslr_web/30k_fold4

  • Tamaño de descarga : 3.59 GiB

  • Tamaño del conjunto de datos : 964.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold5

  • Tamaño de descarga : 3.59 GiB

  • Tamaño del conjunto de datos : 964.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 6,306
'train' 18,919
'vali' 6,306