Microsoft
A pesar de que la idea de utilizar el almacenamiento vectorial en los motores de búsqueda existe desde hace bastante tiempo, en la práctica su implementación se ve obstaculizada por la alta intensidad de recursos de las operaciones con vectores y limitaciones de escalabilidad. La combinación de métodos de aprendizaje automático profundo con algoritmos de búsqueda aproximada del vecino más cercano ha hecho posible llevar el rendimiento y la escalabilidad de los sistemas vectoriales a un nivel aceptable para los grandes motores de búsqueda. Por ejemplo, en Bing, para un índice de vectores de más de 150 mil millones de vectores, el tiempo para obtener los resultados más relevantes es de 8 ms.
La biblioteca incluye herramientas para crear un índice y organizar búsquedas de vectores, así como un conjunto de herramientas para mantener un sistema de búsqueda distribuido en línea que cubra colecciones muy grandes de vectores.
La biblioteca implica que los datos procesados y presentados en la colección están formateados en forma de vectores relacionados que se pueden comparar en función de
Al mismo tiempo, la búsqueda vectorial no se limita al texto y puede aplicarse a información e imágenes multimedia, así como a sistemas de generación automática de recomendaciones. Por ejemplo, uno de los prototipos basado en el framework PyTorch implementó un sistema vectorial de búsqueda basado en la similitud de objetos en imágenes, construido a partir de datos de varias colecciones de referencia con imágenes de animales, gatos y perros, que se convirtieron en conjuntos de vectores. . Cuando se recibe una imagen entrante para su búsqueda, se convierte utilizando un modelo de aprendizaje automático en un vector, en función del cual se seleccionan los vectores más similares del índice utilizando el algoritmo SPTAG y las imágenes asociadas se devuelven como resultado.
Fuente: opennet.ru