ጉግል የማጊካ ፕሮጀክት ክፍት ምንጭ መልቀቁን አስታውቋል፣ ይህም በፋይል ዳታ ትንተና ላይ በመመስረት የይዘት አይነቶችን ለመለየት የተነደፈ ነው። ማጊካ የፕሮግራሚንግ ቋንቋዎችን፣ የመጭመቂያ ዘዴዎችን፣ የመጫኛ ፓኬጆችን፣ የሚተገበር ኮድን፣ የማርክ አፕ አይነቶችን እና በይዘት ውስጥ ያሉ የድምጽ፣ የቪዲዮ፣ የሰነድ እና የምስል ቅርጸቶችን በትክክል መለየት ይችላል። ተያያዥ የመሳሪያ ኪት እና የማሽን መማሪያ ሞዴል በ Apache 2.0 ፈቃድ ስር ታትመዋል።
ማጊካ የማሽን መማሪያ ዘዴዎችን፣ ከፍተኛ አፈጻጸምን እና እጅግ በጣም ጥሩ የመለየት ትክክለኛነትን በመጠቀም በይዘት ላይ ተመስርተው የMIME አይነቶችን ከሚለዩ ተመሳሳይ ፕሮጀክቶች እራሱን ይለያል። ሞዴሉ በ25 ሚሊዮን የፋይል ምሳሌዎች ላይ የኬራስ ማዕቀፍን በመጠቀም የሰለጠነ ሲሆን ቢያንስ 99% ትክክለኛነት ያላቸውን 116 የውሂብ አይነቶችን እውቅና ይደግፋል። ሞዴሉ በ ONNX ቅርጸት የተጠናቀረ ሲሆን መጠኑ 1 ሜባ ብቻ ነው። የጥልቅ ትምህርት ዘዴዎችን መጠቀም ቀደም ሲል ጥቅም ላይ ከዋለው የጉግል ስርዓት ጋር ሲነጻጸር የፍተሻ ትክክለኛነት በ50% እንዲጨምር አድርጓል፣ ይህም በእጅ በተገለጹ ህጎች ላይ የተመሰረተ ነው።

በGoogle ውስጥ፣ ስርዓቱ በደህንነት ፍተሻዎች እና የተገዢነት ፍተሻዎች ወቅት በGmail፣ Drive፣ Code Insight እና Safe Browsing አገልግሎቶች ውስጥ ፋይሎችን ለመመደብ ያገለግላል። የተወሰኑ ተንታኞችን ከማስኬድዎ በፊት ማጊካን እንደ ዋና የፋይል ማጣሪያ አካል ከVirusTotal መድረክ ጋር ለማዋሃድ ስራ እየተሰራ ነው። በGoogle መሠረተ ልማት ውስጥ የተተገበረው የማጊካ ውቅር በሰከንድ በርካታ ሚሊዮን ፋይሎችን እና በሳምንት በመቶ ቢሊዮን የሚቆጠሩ ፋይሎችን ይቃኛል። ሞዴሉን ከጫኑ በኋላ፣ በአንድ የሲፒዩ ኮር ላይ ሲሞከር የግምታዊ ጊዜ ከ5-6 ms ነው። የፍተሻ ጊዜ ከፋይል መጠን ጋር ፈጽሞ የማይገናኝ ነው።
ማጊካን በፕሮጀክቶችዎ ውስጥ ለመጠቀም፣ በአሳሹ ውስጥ ወይም በNode.js ፕሮጀክቶች ውስጥ ሊሰራ የሚችል የትዕዛዝ መስመር መገልገያ፣ የፓይዘን ጥቅል እና የጃቫስክሪፕት ቤተ-መጽሐፍት አዘጋጅተናል። የትዕዛዝ መስመር በይነገጽ እና የኤፒአይ ባች ስራዎችን ይደግፋሉ፣ ይህም በአንድ ጥያቄ ውስጥ ብዙ ፋይሎችን እንዲቃኙ ያስችልዎታል። ለጠቅላላው ማውጫ ተደጋጋሚ የፍተሻ ሁነታ እና የስህተት መቻቻልን ለማስተካከል ሶስት የትንበያ ሁነታዎች አሉ (ከፍተኛ በራስ መተማመን፣ መካከለኛ በራስ መተማመን እና ምርጥ ግምት)።

ምንጭ: opennet.ru
