Microsoft waxay furtay maktabadda raadinta vector-ka ee lagu isticmaalo Bing

Microsoft la daabacay Koodadka ilaha maktabadda barashada mashiinka SPTAG (Space Partition Tree and Graph) oo leh hirgelinta algorithm-ka qiyaas ahaan raadinta deriska ugu dhow. Maktabadda horumaray qaybta cilmi-baarista ee Microsoft Research iyo xarunta horumarinta tignoolajiyada raadinta (Xarunta Tignoolajiyada Raadinta Microsoft). Ficil ahaan, SPTAG waxaa adeegsada mashiinka raadinta Bing si loo go'aamiyo natiijooyinka ugu habboon ee ku saleysan macnaha guud ee weydiimaha raadinta. Koodhku wuxuu ku qoran yahay C++ iyo qaybiyey hoos shatiga MIT. U dhis Linux iyo Windows waa la taageeray. Waxaa jira shuruudo ku xiran luqadda Python.

In kasta oo xaqiiqda ah in fikradda isticmaalka kaydinta vector ee makiinadaha raadinta ay muddo dheer dul sabaynayeen, ficil ahaan, hirgelintooda waxaa caqabad ku ah xoojinta kheyraadka sare ee hawlgallada leh vectors iyo xaddidaadyo xaddidan. Isku darka hababka barashada qoto dheer ee mishiinada iyo qiyaasaha algorithms raadinta deriska ee kuugu dhow ayaa suurtogal ka dhigtay in la keeno waxqabadka iyo miisaanka hababka vector heer la aqbali karo ee matoorada raadinta waaweyn. Tusaale ahaan, gudaha Bing, index vector in ka badan 150 bilyan oo vectors, wakhtiga la keenayo natiijooyinka ugu habboon waa 8 ms gudahood.

Maktabadu waxa ku jira qalab lagu dhisayo tusmaynta iyo habaynta baadhista vector-ka, iyo sidoo kale qalabyo lagu ilaalinayo nidaamka goobidda khadka ee la qaybiyey oo daboolaya ururinta aadka u badan ee vectors. La bixiyay Qaybaha soo socda: index-Builder for indexing, searcher for searching using index loo qaybiyay koox ka kooban dhowr nood, server-ka maamulayaasha qanjirada, Isku-darka isku-darka dhowr server oo mid ah, iyo macmiilka diraya weydiimaha. Ku darida vectors cusub ee tusmada iyo tirtirida xididdada duulista waa la taageeray.

Maktabadu waxay tusinaysaa in xogta la habeeyey ee lagu soo bandhigay ururinta ay u qaabaysan tahay qaab faleebo la xidhiidha oo la barbar dhigi karo iyadoo lagu salaynayo Euclidean (L2) ama cosin fogaansho Weydiinta goobidda waxay soo celisaa xididdada fogaanshahooda u dhexeeya iyaga iyo vectorka asalka ahi uu yar yahay. SPTAG waxay bixisaa laba hab oo loogu talagalay habaynta booska vector: SPTAG-KDT (K-cabbir geedkd-geed) iyo garaafka xaafadda qaraaboiyo SPTAG-BKT (k-macneheedu waa geedk-macneheedu waa geed iyo garaafka xaafadda qaraabo). Habka koowaad wuxuu u baahan yahay kheyraad yar marka la shaqeynayo tusmada, kan labaadna wuxuu muujinayaa saxnaanta sare ee natiijooyinka raadinta ee ururinta aadka u ballaaran.

Isla mar ahaantaana, raadinta vector kuma koobna qoraalka oo waxaa lagu dabaqi karaa macluumaadka warbaahinta badan iyo sawirada, iyo sidoo kale nidaamyada si toos ah u soo saari kara talooyinka. Tusaale ahaan, mid ka mid ah tusaalooyinka ku salaysan qaab-dhismeedka PyTorch ayaa hirgeliyay nidaamka vector ee raadinta ku salaysan isku midka ah walxaha ku jira sawirada, oo la dhisay iyada oo la adeegsanayo xogta laga soo uruuriyay tixraacyo dhowr ah oo leh sawirada xayawaanka, bisadaha iyo eeyaha, kuwaas oo loo beddelay qaybo ka mid ah vectors. . Marka sawirka soo galaya la helo raadinta, waxaa loo beddelaa iyada oo la adeegsanayo qaabka barashada mashiinka oo loo beddelo vector, taas oo ku saleysan kuwa ugu badan ee la midka ah ayaa laga soo xulay tusaha iyadoo la adeegsanayo algorithm SPTAG iyo sawirada la xidhiidha ayaa lagu soo celiyaa natiijada.

Source: opennet.ru

Add a comment