Microsoft
Annak ellenére, hogy a vektortárolás keresőmotorokban való alkalmazásának gondolata már jó ideje lebeg, a gyakorlatban ezek megvalósítását hátráltatja a vektoros műveletek nagy erőforrás-intenzitása és a skálázhatósági korlátok. A mély gépi tanulási módszerek és a hozzávetőleges legközelebbi szomszéd keresési algoritmusok kombinálása lehetővé tette a vektorrendszerek teljesítményének és méretezhetőségének a nagy keresőmotorok számára elfogadható szintre hozását. Például a Bingben egy több mint 150 milliárd vektorból álló vektorindex esetén a legrelevánsabb eredmények lekérésének ideje 8 ms-on belül van.
A könyvtár tartalmazza az index felépítéséhez és a vektoros keresések szervezéséhez szükséges eszközöket, valamint egy nagyon nagy vektorgyűjteményt lefedő, elosztott online keresőrendszer karbantartásához szükséges eszközöket.
A könyvtár azt jelenti, hogy a gyűjteményben feldolgozott és bemutatott adatok kapcsolódó vektorok formájában vannak formázva, amelyek összehasonlíthatók
Ugyanakkor a vektoros keresés nem korlátozódik a szövegre, és alkalmazható multimédiás információkra és képekre, valamint az ajánlásokat automatikusan generáló rendszerekben. Például a PyTorch keretrendszerre épülő prototípusok egyike vektoros rendszert valósított meg a képeken lévő objektumok hasonlóságán alapuló kereséshez, amelyet több referenciagyűjtemény adataiból építettek fel állatok, macskák és kutyák képeivel, amelyeket vektorhalmazokká alakítottak át. . Ha egy bejövő kép érkezik keresésre, az egy gépi tanulási modell segítségével vektorrá konvertálódik, amely alapján az indexből az SPTAG algoritmussal kiválasztják a leginkább hasonló vektorokat, és ennek eredményeként visszaadják a kapcsolódó képeket.
Forrás: opennet.ru