- Descripción :
Incorporaciones preentrenadas para la búsqueda aproximada del vecino más cercano utilizando la distancia euclidiana. Este conjunto de datos consta de dos divisiones:
- 'base de datos': consta de 1 000 000 puntos de datos, cada uno tiene características: 'incrustación' (128 flotantes), 'índice' (int64), 'vecinos' (lista vacía).
- 'prueba': consta de 10,000 puntos de datos, cada uno tiene características: 'incrustación' (128 flotantes), 'índice' (int64), 'vecinos' (lista de 'índice' y 'distancia' de los vecinos más cercanos en la base de datos. )
Página de inicio: http://corpus-texmex.irisa.fr/
Código fuente :
tfds.datasets.sift1m.Builder
Versiones :
-
1.0.0
(predeterminado): Versión inicial.
-
Tamaño de la descarga :
500.80 MiB
Tamaño del conjunto de datos :
589.49 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'database' | 1,000,000 |
'test' | 10,000 |
- Estructura de características :
FeaturesDict({
'embedding': Tensor(shape=(128,), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
incrustación | Tensor | (128,) | flotar32 | |
índice | Escalar | int64 | Índice dentro de la división. | |
vecinos | Secuencia | Los vecinos calculados, que solo están disponibles para la división de prueba. | ||
vecinos/distancia | Escalar | flotar32 | Distancia vecina. | |
vecinos/índice | Escalar | int64 | Índice de vecinos. |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{jegou2010product,
title={Product quantization for nearest neighbor search},
author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
journal={IEEE transactions on pattern analysis and machine intelligence},
volume={33},
number={1},
pages={117--128},
year={2010},
publisher={IEEE}
}