Microsoft
Til tross for at ideen om å bruke vektorlagring i søkemotorer har flytet rundt i ganske lang tid, er implementeringen i praksis hemmet av den høye ressursintensiteten til operasjoner med vektorer og skalerbarhetsbegrensninger. Ved å kombinere dype maskinlæringsmetoder med omtrentlige nærmeste nabosøkealgoritmer har det gjort det mulig å bringe ytelsen og skalerbarheten til vektorsystemer til et nivå som er akseptabelt for store søkemotorer. For eksempel, i Bing, for en vektorindeks på over 150 milliarder vektorer, er tiden for å hente de mest relevante resultatene innenfor 8 ms.
Biblioteket inkluderer verktøy for å bygge en indeks og organisere vektorsøk, samt et sett med verktøy for å vedlikeholde et distribuert nettsøksystem som dekker svært store samlinger av vektorer.
Biblioteket innebærer at dataene som behandles og presenteres i samlingen er formatert i form av relaterte vektorer som kan sammenlignes basert på
Samtidig er vektorsøk ikke begrenset til tekst og kan brukes på multimedieinformasjon og bilder, så vel som i systemer for automatisk generering av anbefalinger. For eksempel implementerte en av prototypene basert på PyTorch-rammeverket et vektorsystem for søk basert på likheten til objekter i bilder, bygget ved hjelp av data fra flere referansesamlinger med bilder av dyr, katter og hunder, som ble konvertert til sett med vektorer . Når et innkommende bilde mottas for søk, konverteres det ved hjelp av en maskinlæringsmodell til en vektor, basert på hvilken de mest like vektorene velges fra indeksen ved hjelp av SPTAG-algoritmen og de tilknyttede bildene returneres som et resultat.
Kilde: opennet.ru