Microsoft pirtûkxaneya lêgerîna vektorê ya ku di Bing-ê de tê bikar anîn çavkaniya vekir

Şirketa Microsoft weşandin Kodên çavkaniya pirtûkxaneya fêrbûna makîneyê SPTAG (Space Partition Tree And Graph) bi pêkanîna algorîtmaya teqrîbî lêgerîna cîranê herî nêzîk. Pirtûkxane pêşxistin di beşa lêkolînê ya Microsoft Research û navenda pêşkeftina teknolojiya lêgerînê de (Navenda Teknolojiya Lêgerîna Microsoft). Di pratîkê de, SPTAG ji hêla motora lêgerînê ya Bing ve tê bikar anîn da ku encamên herî têkildar li ser bingeha çarçoweya pirsên lêgerînê diyar bike. Kod bi C++ û tê nivîsandin belav kirin ji hêla di bin lîsansa MIT. Build ji bo Linux û Windows piştgirî ye. Ji bo zimanê Python girêdanek heye.

Tevî vê rastiyê ku ramana karanîna hilanîna vektorê di motorên lêgerînê de ji bo demek dirêj ve li dora xwe diherike, di pratîkê de, pêkanîna wan ji hêla hêza çavkaniyê ya zêde ya operasyonên bi vektor û sînorkirinên pîvandinê ve tê asteng kirin. Tevhevkirina rêbazên fêrbûna makîneyê ya kûr bi algorîtmayên lêgerîna cîranên nêzîk ên nêzîk re gengaz kiriye ku performans û pîvana pergalên vektorî bigihîne astek ku ji bo motorên lêgerînê yên mezin têne pejirandin. Mînakî, di Bing de, ji bo nîşanek vektorî ya ji zêdetirî 150 mîlyar vektorî, dema ku meriv encamên herî têkildar di nav 8 ms de bigire ye.

Pirtûkxane amûrên ji bo avakirina pêdekek û organîzekirina lêgerînên vektor, û her weha komek amûran ji bo domandina pergala lêgerîna serhêl a belavkirî ku berhevokên pir mezin ên vektoran vedihewîne vedihewîne. Pêşniyar kirin modulên jêrîn: çêkerê îndeksê ji bo îndekskirinê, lêgera ji bo lêgerînê bi karanîna îndeksek ku di komek ji çend girêkan de hatî belav kirin, serverek ji bo xebitandina destanan li ser girêkan, Aggregator ji bo berhevkirina çend pêşkêşkeran di yek de, û xerîdar ji bo şandina pirsan. Tevlêbûna vektorên nû di navnîşan de û jêbirina vektorên li ser firînê piştgirî ye.

Pirtûkxane tê vê wateyê ku daneyên ku di berhevokê de hatine hilanîn û pêşkêş kirin di forma vektorên têkildar de têne form kirin ku li ser bingeha wan têne berhev kirin. Euclidean (L2) an kosînus dûr Pirsa lêgerînê vektorên ku dûrahiya wan û vektora orîjînal hindik e vedigerîne. SPTAG ji bo birêxistinkirina cîhê vektorê du rêbazan peyda dike: SPTAG-KDT (dara K-dimensîyonî)kd-dar) û grafiya taxê ya têkildar) û SPTAG-BKT (k-tê wateya darê (k-tê wateya dar û grafika taxa têkildar). Rêbaza yekem dema ku bi îndeksê re dixebite kêmtir çavkaniyan hewce dike, û ya duyemîn ji bo berhevokên pir mezin ên vektoran rastbûna encamên lêgerînê yên bilindtir nîşan dide.

Di heman demê de, lêgerîna vektorî bi nivîsê re sînordar nabe û dikare li ser agahdarî û wêneyan multimedia, û hem jî di pergalên ku bixweber pêşniyaran çêbikin de were sepandin. Mînakî, yek ji prototîpên ku li ser bingeha çarçoveya PyTorch-ê ji bo lêgerînê li ser bingeha wekheviya tiştên di wêneyan de ye, pergala vektorê pêk anî, ku bi karanîna daneyên ji gelek berhevokên referansê bi wêneyên heywan, pisîk û kûçikan ve hatî çêkirin, ku di nav komên vektoran de hatine veguheztin. . Dema ku wêneyek hatî ji bo lêgerînê tê wergirtin, ew bi karanîna modelek fêrbûna makîneyê vediguhezîne vektorek, ku li ser bingeha wê vektorên herî wekhev ji navnîşê bi karanîna algorîtmaya SPTAG têne hilbijartin û wêneyên têkildar di encamê de têne vegerandin.

Source: opennet.ru

Add a comment