በቪዲዮ ላይ ብዙ ነገሮችን በፍጥነት የሚከታተልበት FairMOT ስርዓት

የማይክሮሶፍት እና ሴንትራል ቻይና ዩኒቨርሲቲ ተመራማሪዎች የዳበረ የማሽን መማሪያ ቴክኖሎጂዎችን በመጠቀም በቪዲዮ ውስጥ ብዙ ነገሮችን ለመከታተል የሚያስችል አዲስ ከፍተኛ አፈጻጸም ዘዴ - ፌርሞት (ፍትሃዊ ባለ ብዙ ነገር መከታተያ)። በፒቶርች እና በሰለጠኑ ሞዴሎች ላይ በመመስረት ዘዴ ትግበራ ያለው ኮድ ታተመ በ GitHub ላይ.

አብዛኛዎቹ ነባር የነገሮች መከታተያ ዘዴዎች ሁለት ደረጃዎችን ይጠቀማሉ፣ እያንዳንዳቸው በተለየ የነርቭ አውታረ መረብ ይተገበራሉ። የመጀመሪያው ደረጃ የፍላጎት ዕቃዎችን ቦታ ለመወሰን ሞዴል ይሠራል, ሁለተኛው ደረጃ ደግሞ እቃዎችን እንደገና ለመለየት እና መልህቆችን ለማያያዝ የማህበር ፍለጋ ሞዴል ይጠቀማል.

FairMOT ሊለወጥ በሚችል ኮንቮሉሽን ነርቭ ኔትወርክ ላይ የተመሰረተ የአንድ-ደረጃ ትግበራ ይጠቀማል (DCNv2, Deformable Convolutional Network), ይህም የነገሮችን የመከታተያ ፍጥነት ላይ ጉልህ የሆነ ጭማሪ እንድታገኙ ያስችልዎታል. ፌርሞቲ ያለ መልህቆች ይሰራል፣ የዳግም መታወቂያ ዘዴን በመጠቀም የነገር ማዕከላትን በከፍተኛ ትክክለኛነት የነገር ካርታ ላይ ለመወሰን። በትይዩ፣ ማንነታቸውን ለመተንበይ የሚያገለግሉ የነገሮችን ግለሰባዊ ገፅታዎች የሚገመግም ፕሮሰሰር ይፈፀማል፣ እና ዋናው ሞጁል የተለያየ ሚዛን ያላቸውን ነገሮች ለመቆጣጠር የእነዚህን ባህሪያት ውህደት ያከናውናል።

በቪዲዮ ላይ ብዙ ነገሮችን በፍጥነት የሚከታተልበት FairMOT ስርዓት

ሞዴሉን በFairMOT ውስጥ ለማሰልጠን፣ የሰዎች ማወቂያ እና ፍለጋ ስድስት የህዝብ የውሂብ ስብስቦች ጥምረት ጥቅም ላይ ውሏል (ETH፣ CityPerson፣ CalTech፣ MOT17፣ CUHK-SYSU)። ሞዴሉ የተሞከረው የቪዲዮ ስብስቦችን በመጠቀም ነው። 2DMOT15, MOT16, MOT17 и MOT20በፕሮጀክቱ የቀረበ የሞቲ ፈተና እና የተለያዩ ሁኔታዎችን, የካሜራ እንቅስቃሴን ወይም መዞርን, የተለያዩ የመመልከቻ ማዕዘኖችን ይሸፍናል. ፈተናው ያንን አሳይቷል።
FairMOT outstrips በጣም ፈጣን ተወዳዳሪ ሞዴሎች TrackRCNN и JDE በ 30 ክፈፎች በሰከንድ የቪዲዮ ዥረቶች ላይ ሲሞከር፣ በበረራ ላይ መደበኛ የቪዲዮ ዥረቶችን ለመተንተን በቂ አፈጻጸም ያሳያል።

ምንጭ: opennet.ru

አስተያየት ያክሉ