Microsoft
Nonostante l’idea di utilizzare l’archiviazione di vettori nei motori di ricerca sia in circolazione da molto tempo, in pratica la loro implementazione è ostacolata dall’elevata intensità di risorse delle operazioni con vettori e dai limiti di scalabilità. La combinazione di metodi di apprendimento automatico approfondito con algoritmi di ricerca approssimata del vicino più vicino ha permesso di portare le prestazioni e la scalabilità dei sistemi vettoriali a un livello accettabile per i grandi motori di ricerca. Ad esempio, in Bing, per un indice vettoriale di oltre 150 miliardi di vettori, il tempo per recuperare i risultati più rilevanti è entro 8 ms.
La libreria include strumenti per creare un indice e organizzare ricerche di vettori, nonché una serie di strumenti per mantenere un sistema di ricerca online distribuito che copre raccolte molto grandi di vettori.
La libreria implica che i dati elaborati e presentati nella raccolta siano formattati sotto forma di vettori correlati che possono essere confrontati in base a
Allo stesso tempo, la ricerca vettoriale non si limita al testo e può essere applicata a informazioni e immagini multimediali, nonché a sistemi per la generazione automatica di raccomandazioni. Ad esempio, uno dei prototipi basati sul framework PyTorch ha implementato un sistema vettoriale per la ricerca basato sulla somiglianza di oggetti nelle immagini, costruito utilizzando dati provenienti da diverse raccolte di riferimento con immagini di animali, gatti e cani, che sono stati convertiti in set di vettori . Quando un'immagine in arrivo viene ricevuta per la ricerca, viene convertita utilizzando un modello di apprendimento automatico in un vettore, in base al quale i vettori più simili vengono selezionati dall'indice utilizzando l'algoritmo SPTAG e di conseguenza vengono restituite le immagini associate.
Fonte: opennet.ru