Microsoft
Apesar de a ideia de usar armazenamento vetorial em motores de busca já existir há bastante tempo, na prática, sua implementação é dificultada pela alta intensidade de recursos das operações com vetores e pelas limitações de escalabilidade. A combinação de métodos profundos de aprendizado de máquina com algoritmos de busca do vizinho mais próximo tornou possível levar o desempenho e a escalabilidade dos sistemas vetoriais a um nível aceitável para grandes mecanismos de busca. Por exemplo, no Bing, para um índice vetorial de mais de 150 bilhões de vetores, o tempo para buscar os resultados mais relevantes é de 8 ms.
A biblioteca inclui ferramentas para construir um índice e organizar pesquisas de vetores, bem como um conjunto de ferramentas para manter um sistema de pesquisa on-line distribuído cobrindo coleções muito grandes de vetores.
A biblioteca implica que os dados processados e apresentados na coleção sejam formatados na forma de vetores relacionados que podem ser comparados com base em
Ao mesmo tempo, a pesquisa vetorial não se limita ao texto e pode ser aplicada a informações multimídia e imagens, bem como em sistemas de geração automática de recomendações. Por exemplo, um dos protótipos baseado no framework PyTorch implementou um sistema vetorial de busca baseado na similaridade de objetos em imagens, construído a partir de dados de diversas coleções de referência com imagens de animais, gatos e cachorros, que foram convertidos em conjuntos de vetores . Quando uma imagem recebida é recebida para pesquisa, ela é convertida em um vetor usando um modelo de aprendizado de máquina, com base no qual os vetores mais semelhantes são selecionados do índice usando o algoritmo SPTAG e as imagens associadas são retornadas como resultado.
Fonte: opennet.ru