Microsoft
Unatoč činjenici da ideja korištenja vektorske memorije u tražilicama pluta već duže vrijeme, u praksi je njihova implementacija otežana velikim intenzitetom resursa operacija s vektorima i ograničenjima skalabilnosti. Kombinovanje metoda dubokog mašinskog učenja sa približnim algoritmima pretraživanja najbližih suseda omogućilo je da se performanse i skalabilnost vektorskih sistema dovedu na nivo prihvatljiv za velike pretraživače. Na primjer, u Bingu, za vektorski indeks od preko 150 milijardi vektora, vrijeme za dohvaćanje najrelevantnijih rezultata je unutar 8 ms.
Biblioteka uključuje alate za izgradnju indeksa i organizovanje vektorskih pretraga, kao i skup alata za održavanje distribuiranog sistema pretraživanja na mreži koji pokriva veoma velike kolekcije vektora.
Biblioteka podrazumijeva da se podaci obrađeni i predstavljeni u kolekciji formatiraju u obliku povezanih vektora koji se mogu porediti na osnovu
Istovremeno, vektorsko pretraživanje nije ograničeno na tekst i može se primijeniti na multimedijalne informacije i slike, kao i na sisteme za automatsko generiranje preporuka. Na primjer, jedan od prototipova baziranih na PyTorch okviru implementirao je vektorski sistem za pretraživanje zasnovan na sličnosti objekata na slikama, izgrađen koristeći podatke iz nekoliko referentnih kolekcija sa slikama životinja, mačaka i pasa, koje su konvertovane u skupove vektora. . Kada se dolazna slika primi za pretragu, ona se konvertuje pomoću modela mašinskog učenja u vektor, na osnovu kojeg se najsličniji vektori biraju iz indeksa pomoću SPTAG algoritma i pridružene slike se vraćaju kao rezultat.
izvor: opennet.ru