Microsoft
Napriek tomu, že myšlienka využitia vektorového úložiska vo vyhľadávačoch sa vznášala už pomerne dlho, v praxi ich implementácii bráni vysoká náročnosť na zdroje operácií s vektormi a obmedzenia škálovateľnosti. Kombinácia metód hlbokého strojového učenia s približnými algoritmami vyhľadávania najbližšieho suseda umožnila posunúť výkon a škálovateľnosť vektorových systémov na úroveň prijateľnú pre veľké vyhľadávače. Napríklad v Bing je pre vektorový index viac ako 150 miliárd vektorov čas na získanie najrelevantnejších výsledkov do 8 ms.
Knižnica obsahuje nástroje na vytváranie indexu a organizáciu vyhľadávania vektorov, ako aj sadu nástrojov na udržiavanie distribuovaného online vyhľadávacieho systému pokrývajúceho veľmi veľké zbierky vektorov.
Z knižnice vyplýva, že údaje spracované a prezentované v kolekcii sú formátované vo forme súvisiacich vektorov, ktoré možno porovnávať na základe
Zároveň sa vektorové vyhľadávanie neobmedzuje len na text a možno ho aplikovať na multimediálne informácie a obrázky, ako aj v systémoch na automatické generovanie odporúčaní. Napríklad jeden z prototypov založených na frameworku PyTorch implementoval vektorový systém pre vyhľadávanie založený na podobnosti objektov na obrázkoch, zostavený s použitím údajov z niekoľkých referenčných kolekcií s obrázkami zvierat, mačiek a psov, ktoré boli prevedené na sady vektorov. . Keď sa prichádzajúci obrázok prijme na vyhľadávanie, prevedie sa pomocou modelu strojového učenia na vektor, na základe ktorého sa z indexu pomocou algoritmu SPTAG vyberú najpodobnejšie vektory a ako výsledok sa vrátia súvisiace obrázky.
Zdroj: opennet.ru