FairMOT, süsteem mitme objekti kiireks jälgimiseks videol

Microsofti ja Kesk-Hiina ülikooli teadlased arenenud uus suure jõudlusega meetod mitme objekti jälgimiseks videos, kasutades masinõppetehnoloogiaid – FairMOT (Fair Multi-Object Tracking). Pytorchil ja koolitatud mudelitel põhineva meetodi juurutusega kood avaldatud GitHubis.

Enamik olemasolevaid objektide jälgimise meetodeid kasutab kahte etappi, millest igaüks on rakendatud eraldi närvivõrgu kaudu. Esimeses etapis käivitatakse huvipakkuvate objektide asukoha määramise mudel ja teises etapis kasutatakse assotsiatsiooniotsingu mudelit, mida kasutatakse objektide uuesti tuvastamiseks ja ankrute kinnitamiseks.

FairMOT kasutab üheastmelist teostust, mis põhineb deformeeritaval konvolutsioonilisel närvivõrgul (DCNv2, Deformeeritav konvolutsioonivõrk), mis võimaldab saavutada objekti jälgimise kiiruse märgatava tõusu. FairMOT töötab ilma ankruteta, kasutades uuesti tuvastamise mehhanismi, et määrata objektide keskpunktide nihked ülitäpsel objektikaardil. Paralleelselt käivitatakse protsessor, mis hindab objektide individuaalseid omadusi, mille abil saab nende identiteeti ennustada, ja põhimoodul teostab nende omaduste konvergentsi, et manipuleerida erineva ulatusega objekte.

FairMOT, süsteem mitme objekti kiireks jälgimiseks videol

Mudeli koolitamiseks FairMOTis kasutati inimeste tuvastamiseks ja otsimiseks mõeldud kuue avaliku andmestiku kombinatsiooni (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Mudelit testiti videote testkomplektide abil 2DMOT15, MOT16, MOT17 и MOT20ette nähtud MOT väljakutse ja erinevate olukordade katmine, kaamera liikumine või pöörlemine, erinevad vaatenurgad. Test näitas seda
FairMOT ületab kiireimad konkureerivad mudelid Jälgi RCNN и J.D.E. testimisel 30 kaadrit sekundis videovoogudega, mis näitab piisavat jõudlust tavaliste videovoogude käigupealt analüüsimiseks.

Allikas: opennet.ru

Lisa kommentaar