- Mô tả :
Các nhúng được đào tạo trước để tìm kiếm hàng xóm gần nhất bằng cách sử dụng khoảng cách cosine. Bộ dữ liệu này bao gồm hai phần:
- 'cơ sở dữ liệu': bao gồm 9.990.000 điểm dữ liệu, mỗi điểm có các tính năng: 'nhúng' (96 số float), 'chỉ mục' (int64), 'hàng xóm' (danh sách trống).
- 'test': gồm 10.000 điểm dữ liệu, mỗi điểm có các tính năng: 'embedding' (96 float), 'index' (int64), 'neighbors' (danh sách 'index' và 'khoảng cách' của các láng giềng gần nhất trong cơ sở dữ liệu. )
Trang chủ : http://sites.skoltech.ru/compvision/noimi/
Mã nguồn :
tfds.nearest_neighbors.deep1b.Deep1b
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
3.58 GiB
Kích thước tập dữ liệu :
4.46 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'database' | 9.990.000 |
'test' | 10.000 |
- Cấu trúc tính năng :
FeaturesDict({
'embedding': Tensor(shape=(96,), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
nhúng | tenxơ | (96,) | phao32 | |
mục lục | Vô hướng | int64 | Chỉ mục trong phần chia. | |
người hàng xóm | Sự phối hợp | Hàng xóm được tính toán, chỉ khả dụng cho phân tách thử nghiệm. | ||
hàng xóm/khoảng cách | Vô hướng | phao32 | Khoảng cách hàng xóm. | |
hàng xóm/chỉ số | Vô hướng | int64 | Chỉ số hàng xóm |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{babenko2016efficient,
title={Efficient indexing of billion-scale datasets of deep descriptors},
author={Babenko, Artem and Lempitsky, Victor},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={2055--2063},
year={2016}
}