Microsoft
Sa kabila ng katotohanan na ang ideya ng paggamit ng vector storage sa mga search engine ay medyo matagal nang lumulutang, sa pagsasagawa, ang kanilang pagpapatupad ay nahahadlangan ng mataas na resource intensity ng mga operasyon na may mga vectors at mga limitasyon sa scalability. Ang pagsasama-sama ng malalim na mga pamamaraan sa pag-aaral ng makina sa tinatayang pinakamalapit na mga algorithm sa paghahanap ng kapitbahay ay naging posible upang dalhin ang pagganap at scalability ng mga vector system sa isang antas na katanggap-tanggap para sa malalaking search engine. Halimbawa, sa Bing, para sa isang vector index na higit sa 150 bilyong vectors, ang oras para makuha ang mga pinakanauugnay na resulta ay nasa loob ng 8 ms.
Kasama sa library ang mga tool para sa pagbuo ng isang index at pag-aayos ng mga vector search, pati na rin ang isang set ng mga tool para sa pagpapanatili ng isang distributed online search system na sumasaklaw sa napakalaking koleksyon ng mga vector.
Ang aklatan ay nagpapahiwatig na ang data na naproseso at ipinakita sa koleksyon ay naka-format sa anyo ng mga kaugnay na vectors na maaaring ihambing batay sa
Kasabay nito, ang paghahanap ng vector ay hindi limitado sa teksto at maaaring ilapat sa impormasyon at mga imahe ng multimedia, pati na rin sa mga system para sa awtomatikong pagbuo ng mga rekomendasyon. Halimbawa, ang isa sa mga prototype batay sa balangkas ng PyTorch ay nagpatupad ng isang vector system para sa paghahanap batay sa pagkakapareho ng mga bagay sa mga imahe, na binuo gamit ang data mula sa ilang mga koleksyon ng sanggunian na may mga larawan ng mga hayop, pusa at aso, na na-convert sa mga hanay ng mga vector. . Kapag ang isang papasok na imahe ay natanggap para sa paghahanap, ito ay kino-convert gamit ang isang machine learning model sa isang vector, batay sa kung saan ang pinakakatulad na mga vector ay pinili mula sa index gamit ang SPTAG algorithm at ang mga nauugnay na imahe ay ibinalik bilang isang resulta.
Pinagmulan: opennet.ru