Microsoft
Kljub dejstvu, da se ideja o uporabi vektorskega shranjevanja v iskalnikih pojavlja že precej dolgo, v praksi njihovo izvajanje ovirajo visoka intenzivnost virov operacij z vektorji in omejitve razširljivosti. Združevanje metod globokega strojnega učenja z algoritmi iskanja po približnih najbližjih sosedih je omogočilo, da se zmogljivost in razširljivost vektorskih sistemov dvigne na raven, ki je sprejemljiva za velike iskalnike. Na primer, v Bingu je za vektorski indeks z več kot 150 milijardami vektorjev čas za pridobivanje najbolj ustreznih rezultatov znotraj 8 ms.
Knjižnica vključuje orodja za gradnjo indeksa in organiziranje vektorskih iskanj ter nabor orodij za vzdrževanje porazdeljenega spletnega iskalnega sistema, ki pokriva zelo velike zbirke vektorjev.
Knjižnica pomeni, da so podatki, obdelani in predstavljeni v zbirki, oblikovani v obliki povezanih vektorjev, ki jih je mogoče primerjati na podlagi
Hkrati pa vektorsko iskanje ni omejeno na besedilo in se lahko uporablja za večpredstavnostne informacije in slike, pa tudi v sistemih za samodejno generiranje priporočil. Na primer, eden od prototipov, ki temelji na ogrodju PyTorch, je implementiral vektorski sistem za iskanje na podlagi podobnosti predmetov na slikah, zgrajen na podlagi podatkov iz več referenčnih zbirk s slikami živali, mačk in psov, ki so bili pretvorjeni v nize vektorjev . Ko je dohodna slika prejeta v iskanje, se ta pretvori z modelom strojnega učenja v vektor, na podlagi katerega se iz indeksa z algoritmom SPTAG izberejo najbolj podobni vektorji in kot rezultat se vrnejo pripadajoče slike.
Vir: opennet.ru