Microsoft
În ciuda faptului că ideea de a folosi stocarea vectorială în motoarele de căutare plutește de destul de mult timp, în practică, implementarea lor este îngreunată de intensitatea ridicată a resurselor operațiunilor cu vectori și limitările de scalabilitate. Combinarea metodelor de învățare automată profundă cu algoritmi aproximativi de căutare a vecinului cel mai apropiat a făcut posibilă aducerea performanței și scalabilității sistemelor vectoriale la un nivel acceptabil pentru motoarele de căutare mari. De exemplu, în Bing, pentru un indice vectorial de peste 150 de miliarde de vectori, timpul pentru a obține cele mai relevante rezultate este în 8 ms.
Biblioteca include instrumente pentru construirea unui index și organizarea căutărilor vectoriale, precum și un set de instrumente pentru menținerea unui sistem de căutare online distribuit care acoperă colecții foarte mari de vectori.
Biblioteca implică faptul că datele prelucrate și prezentate în colecție sunt formatate sub formă de vectori înrudiți care pot fi comparați pe baza
În același timp, căutarea vectorială nu se limitează la text și poate fi aplicată informațiilor și imaginilor multimedia, precum și în sistemele de generare automată a recomandărilor. De exemplu, unul dintre prototipurile bazate pe framework-ul PyTorch a implementat un sistem vectorial de căutare bazat pe asemănarea obiectelor din imagini, construit folosind date din mai multe colecții de referință cu imagini de animale, pisici și câini, care au fost convertite în seturi de vectori. . Când o imagine primită este primită pentru căutare, aceasta este convertită folosind un model de învățare automată într-un vector, pe baza căruia cei mai asemănători vectori sunt selectați din index folosind algoritmul SPTAG și imaginile asociate sunt returnate ca rezultat.
Sursa: opennet.ru