deep1b

  • توضیحات :

جاسازی های از پیش آموزش دیده برای جستجوی تقریبی نزدیکترین همسایه با استفاده از فاصله کسینوس. این مجموعه داده از دو تقسیم تشکیل شده است:

  1. 'پایگاه داده': شامل 9,990,000 نقطه داده است که هر کدام دارای ویژگی هایی است: 'جاسازی' (96 شناور)، 'ایندکس' (int64)، 'همسایگان' (فهرست خالی).
  2. "تست": شامل 10000 نقطه داده است که هر کدام دارای ویژگی هایی است: "جاسازی" (96 شناور)، "شاخص" (int64)، "همسایگان" (فهرست "شاخص" و "فاصله" نزدیکترین همسایگان در پایگاه داده. )
تقسیم کنید نمونه ها
'database' 9,990,000
'test' 10000
  • ساختار ویژگی :
FeaturesDict({
    'embedding': Tensor(shape=(96,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
        'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D توضیحات
FeaturesDict
تعبیه کردن تانسور (96،) float32
شاخص اسکالر int64 شاخص در شکاف.
همسایه ها دنباله همسایه های محاسبه شده، که فقط برای تقسیم تست در دسترس است.
همسایگان/فاصله اسکالر float32 فاصله همسایه
همسایگان/شاخص اسکالر int64 شاخص همسایه.
  • نقل قول :
@inproceedings{babenko2016efficient,
  title={Efficient indexing of billion-scale datasets of deep descriptors},
  author={Babenko, Artem and Lempitsky, Victor},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={2055--2063},
  year={2016}
}