ማይክሮሶፍት Bing የሚጠቀምበትን የቬክተር መፈለጊያ ላይብረሪ ኮድ ከፍቷል።

ማይክሮሶፍት ታትሟል የማሽን መማሪያ ቤተ መጻሕፍት ምንጭ ኮዶች SPTAG (የጠፈር ክፍልፍል ዛፍ እና ግራፍ) ከግምታዊ ስልተ ቀመር ትግበራ ጋር የቅርብ ጎረቤት ፍለጋ. ቤተ መፃህፍት የዳበረ በማይክሮሶፍት ምርምር ምርምር ክፍል እና በፍለጋ ቴክኖሎጂ ልማት ማእከል (ማይክሮሶፍት ፍለጋ ቴክኖሎጂ ማእከል) ። በተግባር፣ SPTAG በፍለጋ መጠይቆች አውድ ላይ ተመስርተው በጣም ተዛማጅ ውጤቶችን ለመወሰን በBing የፍለጋ ሞተር ይጠቀማል። ኮዱ በ C ++ እና ተጽፏል የተሰራጨው በ በ MIT ፈቃድ. ለሊኑክስ እና ዊንዶውስ መገንባት ይደገፋል። ለፓይዘን ቋንቋ አስገዳጅነት አለ።

ምንም እንኳን በፍለጋ ሞተሮች ውስጥ የቬክተር ማከማቻን የመጠቀም ሀሳብ ለረጅም ጊዜ ሲንሳፈፍ የቆየ ቢሆንም ፣ በተግባር ግን ፣ የእነሱ ትግበራ በከፍተኛ የሃብት ጥንካሬ እና በ vectors እና በተመጣጣኝ ውስንነት ውስንነት የተስተጓጎለ ነው። ጥልቅ የማሽን መማሪያ ዘዴዎችን ከጎረቤት የፍለጋ ስልተ ቀመሮች ጋር በማጣመር የቬክተር ሲስተሞችን አፈጻጸም እና መጠነ ሰፊነት ለትልቅ የፍለጋ ሞተሮች ተቀባይነት ያለው ደረጃ ላይ ለመድረስ አስችሏል። ለምሳሌ፣ በBing ውስጥ፣ ከ150 ቢሊዮን በላይ ቬክተር ላለው የቬክተር መረጃ ጠቋሚ፣ በጣም አስፈላጊ የሆኑትን ውጤቶች ለማግኘት ጊዜው በ8 ሚሴ ውስጥ ነው።

ቤተ መፃህፍቱ ኢንዴክስን ለመገንባት እና የቬክተር ፍለጋዎችን ለማደራጀት የሚረዱ መሳሪያዎችን እንዲሁም በጣም ትልቅ የሆኑ የቬክተር ስብስቦችን የሚሸፍን የተከፋፈለ የመስመር ላይ ፍለጋ ስርዓትን ለመጠበቅ የሚረዱ መሳሪያዎችን ያካትታል። ቀርቧል የሚከተሉት ሞጁሎች፡ መረጃ ጠቋሚ ገንቢ፣ በበርካታ ኖዶች ክላስተር ውስጥ የተከፋፈለ መረጃ ጠቋሚን በመጠቀም ፍለጋን፣ በመስቀለኛ መንገዱ ላይ የሚሠሩ ተቆጣጣሪዎች አገልጋይ፣ ብዙ አገልጋዮችን ወደ አንድ በማጣመር ሰብሳቢ እና መጠይቆችን ለመላክ ደንበኛ። አዳዲስ ቬክተሮችን ወደ ኢንዴክስ ማካተት እና በመብረር ላይ ያሉ ቬክተሮች መሰረዝ ይደገፋሉ.

ቤተ መፃህፍቱ የሚያመለክተው በክምችቱ ውስጥ የተቀነባበረ እና የቀረበው መረጃ በተዛማጅ ቬክተር መልክ የተቀረፀ ሲሆን ይህም ላይ ተመስርተው ሊነፃፀሩ ይችላሉ. Euclidean (L2) ወይም ኮሳይን ርቀቶች የፍለጋ መጠይቁ በእነሱ እና በዋናው ቬክተር መካከል ያለው ርቀት አነስተኛ የሆኑትን ቬክተሮች ይመልሳል። SPTAG የቬክተር ቦታን ለማደራጀት ሁለት ዘዴዎችን ይሰጣል-SPTAG-KDT (K-dimensional tree (K-dimensional tree)kd-ዛፍ) እና አንጻራዊ የአጎራባች ግራፍ) እና SPTAG-BKT (k-means ዛፍ (k - ዛፍ ማለት ነው። እና አንጻራዊ የአጎራባች ግራፍ). የመጀመሪያው ዘዴ ከመረጃ ጠቋሚው ጋር ሲሰራ አነስተኛ ሀብቶችን ይፈልጋል, ሁለተኛው ደግሞ በጣም ትልቅ ለሆኑ የቬክተሮች ስብስቦች ከፍተኛ የፍለጋ ውጤቶችን ትክክለኛነት ያሳያል.

በተመሳሳይ ጊዜ የቬክተር ፍለጋ በጽሑፍ ብቻ የተገደበ አይደለም እና ለመልቲሚዲያ መረጃ እና ምስሎች እንዲሁም ምክሮችን በራስ-ሰር ለማመንጨት በስርዓቶች ላይ ሊተገበር ይችላል። ለምሳሌ ፣ በፒቶርች ማዕቀፍ ላይ ከተመሰረቱት ምሳሌዎች ውስጥ በምስሎች ውስጥ ባሉ ዕቃዎች ተመሳሳይነት ላይ በመመርኮዝ የቬክተር ስርዓትን ለመፈለግ የቬክተር ስርዓትን በመተግበር የእንስሳት ፣ የድመቶች እና የውሻ ምስሎች ያላቸው ከበርካታ የማጣቀሻ ስብስቦች የተገኘውን መረጃ በመጠቀም የተሰራ ሲሆን ወደ ቬክተር ስብስብ ተለውጠዋል ። . ገቢ ምስል ለፍለጋ ሲደርሰው የማሽን መማሪያ ሞዴልን በመጠቀም ወደ ቬክተር ይቀየራል, በዚህ መሰረት በጣም ተመሳሳይ የሆኑ ቬክተሮች በ SPTAG ስልተ-ቀመር በመጠቀም ከመረጃ ጠቋሚው ውስጥ ተመርጠዋል እና ተያያዥ ምስሎች በዚህ ምክንያት ይመለሳሉ.

ምንጭ: opennet.ru

አስተያየት ያክሉ