Microsoft open source ny tranomboky fikarohana vector ampiasaina ao amin'ny Bing

Microsoft namoaka kaody loharanon'ny tranomboky fianarana milina SPTAG (Space Partition Tree And Graph) miaraka amin'ny fampiharana ny algorithm eo ho eo fikarohana mpifanolo-bodirindrina akaiky indrindra. -BOKIN'NY Vavolombelon'i Jehovah lasa ao amin'ny fizarana fikarohana ao amin'ny Microsoft Research sy ny foibe fampandrosoana ny teknolojia fikarohana (Microsoft Search Technology Center). Amin'ny fampiharana, SPTAG dia ampiasain'ny motera fikarohana Bing mba hamaritana ny valiny mifandraika indrindra mifototra amin'ny tontolon'ny fangatahana fikarohana. Ny kaody dia voasoratra ao amin'ny C ++ ary nozarain'i eo ambanin'ny lisansa MIT. Manohana ny Build ho an'ny Linux sy Windows. Misy fatorana ho an'ny fiteny Python.

Na dia eo aza ny zava-misy fa ny hevitra momba ny fampiasana ny fitahirizana vector amin'ny milina fikarohana dia nitsinkafona nandritra ny fotoana ela, raha ny fampiharana, ny fampiharana azy ireo dia voasakana noho ny hamafin'ny loharanon-karena avo amin'ny asa miaraka amin'ny vectors sy ny fetran'ny scalability. Ny fampifangaroana ny fomba fianarana milina lalina miaraka amin'ny algorithm fikarohana mpifanolo-bodirindrina akaiky akaiky indrindra dia nahafahana nitondra ny fahaiza-manao sy ny fampitomboana ny rafitra vector ho amin'ny ambaratonga azo ekena ho an'ny milina fikarohana lehibe. Ohatra, ao amin'ny Bing, ho an'ny mari-pamantarana vetaveta misy vectors maherin'ny 150 lavitrisa, ao anatin'ny 8 ms ny fotoana handraisana ireo valiny tena ilaina.

Ny trano famakiam-boky dia ahitana fitaovana amin'ny fananganana tondro sy fandaminana fikarohana vetaveta, ary koa fitaovana iray ho an'ny fitazonana rafitra fikarohana an-tserasera zaraina mandrakotra angon-drakitra be dia be. nanatitra ireto maodely manaraka ireto: mpanorina index ho an'ny fanondroana, mpitady amin'ny fikarohana amin'ny fampiasana index nozaraina ao anaty cluster misy node maromaro, mpizara ho an'ny mpitantana ny nodes, Aggregator amin'ny fampifangaroana servisy maromaro ho iray, ary mpanjifa amin'ny fandefasana fanontaniana. Ny fampidirana vectors vaovao ao amin'ny index sy ny famafana ny vectors amin'ny sidina dia tohanana.

Ny tranomboky dia midika fa ny angon-drakitra voahodina sy naseho tao amin'ny fanangonana dia voalamina amin'ny endrika vectors mifandraika izay azo ampitahaina mifototra amin'ny Euclidean (L2) na cosine lavitra Ny fangatahana karoka dia mamerina ireo vector izay kely indrindra ny elanelana misy eo amin'izy ireo sy ny vector voalohany. SPTAG dia manome fomba roa amin'ny fandaminana ny habaka vector: SPTAG-KDT (K-dimensional tree (kd-hazo) ary tabilao manodidina ny manodidina) ary SPTAG-BKT (k-means hazo (k-midika hazo ary grafofaon'ny manodidina). Ny fomba voalohany dia mitaky loharanon-karena kely kokoa rehefa miasa miaraka amin'ny index, ary ny faharoa dia mampiseho ny fahamarinan'ny valin'ny fikarohana ho an'ny fanangonana vectors tena lehibe.

Mandritra izany fotoana izany, ny fikarohana vΓ©ctor dia tsy voafetra amin'ny lahatsoratra ary azo ampiharina amin'ny fampahalalana sy sary multimedia, ary koa amin'ny rafitra hamoronana tolo-kevitra ho azy. Ohatra, ny iray amin'ireo prototype mifototra amin'ny rafitra PyTorch dia nametraka rafitra vetaveta ho an'ny fikarohana mifototra amin'ny fitoviana amin'ny zavatra amin'ny sary, natsangana tamin'ny fampiasana angona avy amin'ny fanangonana references maromaro miaraka amin'ny sarin'ny biby, saka ary alika, izay navadika ho andiana vectors. . Rehefa voaray ho fikarohana ny sary miditra dia avadika amin'ny alalan'ny maodelin'ny fianarana milina izany ho lasa vector, mifototra amin'ny fisafidianan'ireo vectors mitovy indrindra amin'ny index amin'ny alΓ lan'ny algorithm SPTAG ary averina ireo sary mifandraika amin'izany.

Source: opennet.ru

Add a comment