- Mô tả :
MSLR-WEB là hai bộ dữ liệu Học tập để Xếp hạng quy mô lớn do Microsoft Research phát hành. Tập dữ liệu đầu tiên (gọi là "30k") chứa 30.000 truy vấn và tập dữ liệu thứ hai (gọi là "10k") chứa 10.000 truy vấn. Mỗi tập dữ liệu bao gồm các cặp tài liệu truy vấn được biểu diễn dưới dạng vectơ đặc trưng và nhãn đánh giá mức độ phù hợp tương ứng.
Bạn có thể chỉ định nên sử dụng phiên bản "10k" hay "30k" của bộ dữ liệu và một nếp gấp tương ứng, như sau:
ds = tfds.load("mslr_web/30k_fold1")
Nếu chỉ mslr_web
được chỉ định, tùy chọn mslr_web/10k_fold1
được chọn theo mặc định:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Trang chủ : https://www.microsoft.com/en-us/research/project/mslr/
Mã nguồn :
tfds.ranking.mslr_web.MslrWeb
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
1.1.0
: Nhóm các tính năng thành một tính năng 'float_features' duy nhất. -
1.2.0
(mặc định): Thêm số nhận dạng truy vấn và tài liệu.
-
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Cấu trúc tính năng :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Đặc tính | Tầng lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
doc_id | tenxơ | (Không có,) | int64 | |
float_features | tenxơ | (Không có, 136) | phao64 | |
nhãn | tenxơ | (Không có,) | phao64 | |
query_id | Chữ | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (cấu hình mặc định)
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
310.08 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/10k_fold2
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
310.08 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/10k_fold3
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
310.08 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/10k_fold4
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
310.08 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/10k_fold5
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
310.08 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/30k_fold1
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
964.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/30k_fold2
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
964.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/30k_fold3
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
964.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/30k_fold4
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
964.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ví dụ ( tfds.as_dataframe ):
mslr_web/30k_fold5
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
964.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- Ví dụ ( tfds.as_dataframe ):