Microsoft
Navzdory tomu, že myšlenka využití vektorového úložiště ve vyhledávačích se vznášela již poměrně dlouho, v praxi jejich implementaci brzdí vysoká náročnost na zdroje operací s vektory a omezení škálovatelnosti. Kombinace metod hlubokého strojového učení s přibližnými algoritmy pro vyhledávání nejbližších sousedů umožnila posunout výkon a škálovatelnost vektorových systémů na úroveň přijatelnou pro velké vyhledávače. Například v Bingu je pro vektorový index s více než 150 miliardami vektorů čas pro načtení nejrelevantnějších výsledků do 8 ms.
Knihovna obsahuje nástroje pro vytváření indexu a organizaci vyhledávání vektorů a také sadu nástrojů pro údržbu distribuovaného online vyhledávacího systému pokrývajícího velmi rozsáhlé sbírky vektorů.
Z knihovny vyplývá, že data zpracovávaná a prezentovaná ve sbírce jsou formátována ve formě příbuzných vektorů, které lze porovnávat na základě
Vektorové vyhledávání se přitom neomezuje pouze na text a lze jej aplikovat na multimediální informace a obrázky i v systémech pro automatické generování doporučení. Například jeden z prototypů založených na frameworku PyTorch implementoval vektorový systém pro vyhledávání založený na podobnosti objektů v obrázcích, vytvořený pomocí dat z několika referenčních kolekcí s obrázky zvířat, koček a psů, které byly převedeny na sady vektorů. . Když je příchozí obrázek přijat pro vyhledávání, je převeden pomocí modelu strojového učení na vektor, na základě kterého jsou pomocí algoritmu SPTAG vybrány z indexu nejpodobnější vektory a jako výsledek jsou vráceny související obrázky.
Zdroj: opennet.ru