Fhuair Microsoft stòr fosgailte an leabharlann sgrùdaidh vector a chaidh a chleachdadh ann am Bing

Microsoft foillsichte còdan stòr leabharlainn ionnsachadh inneal SPTAG (Space Partition Tree And Graph) le buileachadh an algairim tuairmseach lorg nàbaidh as fhaisge. Leabharlann leasaichte ann an roinn rannsachaidh Microsoft Research agus an ionad leasachaidh teicneòlas sgrùdaidh (Ionad Teicneòlais Rannsachaidh Microsoft). Ann an cleachdadh, tha SPTAG air a chleachdadh le einnsean sgrùdaidh Bing gus na toraidhean as iomchaidh a dhearbhadh stèidhichte air co-theacsa cheistean rannsachaidh. Tha an còd sgrìobhte ann an C ++ agus air a sgaoileadh le fo chead MIT. Tha Build airson Linux agus Windows a’ faighinn taic. Tha ceangal ann airson cànan Python.

A dh ’aindeoin gu bheil am beachd a bhith a’ cleachdadh stòradh vector ann an einnseanan luirg air a bhith a ’dol timcheall airson ùine mhòr, ann an cleachdadh, tha am buileachadh air a bhacadh leis cho dian sa tha goireasan gnìomhachd le vectaran agus crìochan scalability. Le bhith a’ cothlamadh dhòighean ionnsachaidh inneal domhainn leis na h-algorithms lorg nàbaidh as fhaisge tha e comasach coileanadh agus scalability siostaman vector a thoirt gu ìre iomchaidh airson einnseanan sgrùdaidh mòra. Mar eisimpleir, ann am Bing, airson clàr-amais vector de chòrr air 150 billean vectar, tha an ùine airson na toraidhean as buntainniche fhaighinn taobh a-staigh 8 ms.

Tha innealan anns an leabharlann airson clàr-amais a thogail agus rannsachaidhean feòir a chuir air dòigh, a bharrachd air seata innealan airson siostam sgrùdaidh sgaoilte air-loidhne a chumail a’ còmhdach cruinneachaidhean fìor mhòr de vectaran. Air a thabhann na modalan a leanas: neach-togail clàr-amais airson clàr-amais, neach-sgrùdaidh airson sgrùdadh a’ cleachdadh clàr-amais air a chuairteachadh ann am buidheann de ghrunn nodan, frithealaiche airson làimhseachadh làimhseachadh air nodan, Aggregator airson grunn luchd-frithealaidh a chur còmhla ann an aon, agus teachdaiche airson ceistean a chuir. Thathas a’ toirt taic do bhith a’ toirt a-steach vectaran ùra a-steach don chlàr-amais agus cuir às do vectaran air an itealan.

Tha an leabharlann a’ ciallachadh gu bheil an dàta a chaidh a ghiullachd agus a thaisbeanadh sa chruinneachadh air a chruth ann an cruth vectaran co-cheangailte a ghabhas coimeas a rèir Euclidanaich (L2) neo cosine astaran Bidh a’ cheist rannsachaidh a’ tilleadh vectaran aig nach eil ach glè bheag de dh’ astar eadar iad agus an vectar tùsail. Tha SPTAG a’ toirt seachad dà dhòigh air àite vector a chuir air dòigh: SPTAG-KDT (craobh K-mheudach (kd-chraobh) agus graf nàbaidheachd càirdeil) agus SPTAG-BKT (k-a’ ciallachadh craobh (k-a 'ciallachadh craobh agus graf nàbachd càirdeach). Tha a’ chiad dòigh a’ cur feum air nas lugha de ghoireasan nuair a thathar ag obair leis a’ chlàr-amais, agus tha an dàrna fear a’ nochdadh cruinneas nas àirde de thoraidhean rannsachaidh airson cruinneachaidhean fìor mhòr de vectaran.

Aig an aon àm, chan eil sgrùdadh vector cuingealaichte ri teacsa agus faodar a chuir an sàs ann am fiosrachadh ioma-mheadhain agus ìomhaighean, a bharrachd air ann an siostaman airson molaidhean a ghineadh gu fèin-ghluasadach. Mar eisimpleir, chuir aon de na prototypes a tha stèidhichte air frèam PyTorch an gnìomh siostam vectar airson sgrùdadh stèidhichte air coltas nithean ann an ìomhaighean, air a thogail a’ cleachdadh dàta bho ghrunn chruinneachaidhean iomraidh le ìomhaighean de bheathaichean, cait is coin, a chaidh an atharrachadh gu seataichean de vectaran. . Nuair a gheibhear ìomhaigh a tha a’ tighinn a-steach airson sgrùdadh, thèid a thionndadh le bhith a’ cleachdadh modal ionnsachaidh inneal gu bhith na vectar, stèidhichte air a bheil na vectaran as coltaiche air an taghadh bhon chlàr-amais a’ cleachdadh an algairim SPTAG agus tha na h-ìomhaighean co-cheangailte air an tilleadh mar thoradh air an sin.

Source: fosgailtenet.ru

Cuir beachd ann