Microsoft
På trods af at ideen om at bruge vektorlagring i søgemaskiner har svævet rundt i ret lang tid, er implementeringen i praksis hæmmet af den høje ressourceintensitet af operationer med vektorer og skalerbarhedsbegrænsninger. Kombinationen af dybe maskinlæringsmetoder med omtrentlige nærmeste nabosøgealgoritmer har gjort det muligt at bringe vektorsystemernes ydeevne og skalerbarhed til et niveau, der er acceptabelt for store søgemaskiner. For eksempel, i Bing, for et vektorindeks på over 150 milliarder vektorer, er tiden til at hente de mest relevante resultater inden for 8 ms.
Biblioteket indeholder værktøjer til at opbygge et indeks og organisere vektorsøgninger, samt et sæt værktøjer til at vedligeholde et distribueret online søgesystem, der dækker meget store samlinger af vektorer.
Biblioteket indebærer, at de data, der behandles og præsenteres i samlingen, er formateret i form af relaterede vektorer, der kan sammenlignes ud fra
Samtidig er vektorsøgning ikke begrænset til tekst og kan anvendes på multimedieinformation og billeder såvel som i systemer til automatisk generering af anbefalinger. For eksempel implementerede en af prototyperne baseret på PyTorch-rammeværket et vektorsystem til søgning baseret på ligheden mellem objekter i billeder, bygget ved hjælp af data fra flere referencesamlinger med billeder af dyr, katte og hunde, som blev konverteret til sæt af vektorer . Når et indkommende billede modtages til søgning, konverteres det ved hjælp af en maskinlæringsmodel til en vektor, baseret på hvilken de mest lignende vektorer vælges fra indekset ved hjælp af SPTAG-algoritmen, og de tilknyttede billeder returneres som et resultat.
Kilde: opennet.ru