FairMOT, sistēma, kas ātri izseko vairākus objektus video

Pētnieki no Microsoft un Centrālās Ķīnas universitātes izstrādāta jauna augstas veiktspējas metode vairāku objektu izsekošanai video, izmantojot mašīnmācīšanās tehnoloģijas - FairMOT (Fair Multi-Object Tracking). Kods ar metodes ieviešanu, pamatojoties uz Pytorch un apmācītiem modeļiem publicēts vietnē GitHub.

Lielākajā daļā esošo objektu izsekošanas metožu tiek izmantoti divi posmi, no kuriem katrs tiek īstenots ar atsevišķu neironu tīklu. Pirmajā posmā tiek palaists modelis interesējošo objektu atrašanās vietas noteikšanai, bet otrajā posmā tiek izmantots asociācijas meklēšanas modelis, ko izmanto, lai atkārtoti identificētu objektus un pievienotu tiem enkurus.

FairMOT izmanto vienpakāpes ieviešanu, kuras pamatā ir deformējams konvolucionālais neironu tīkls (DCNv2, Deformējamais konvolucionālais tīkls), kas ļauj sasniegt ievērojamu objektu izsekošanas ātruma pieaugumu. FairMOT darbojas bez enkuriem, izmantojot atkārtotas identifikācijas mehānismu, lai noteiktu objektu centru nobīdes augstas precizitātes objektu kartē. Paralēli tiek izpildīts procesors, kas novērtē objektu individuālās pazīmes, kuras var izmantot, lai prognozētu to identitāti, un galvenais modulis veic šo pazīmju konverģenci, lai manipulētu ar dažāda mēroga objektiem.

FairMOT, sistēma, kas ātri izseko vairākus objektus video

Lai apmācītu modeli FairMOT, tika izmantota sešu publisko datu kopu kombinācija cilvēku noteikšanai un meklēšanai (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Modelis tika pārbaudīts, izmantojot testa video kopas 2DMOT15, MOT16, MOT17 и MOT20ko nodrošina projekts MOT izaicinājums un aptver dažādas situācijas, kameras kustību vai rotāciju, dažādus skata leņķus. Pārbaude to parādīja
FairMOT apsteidz ātrākie konkurējošie modeļi TrackRCNN и JDE pārbaudot ar 30 kadriem sekundē video straumēm, demonstrējot veiktspēju, kas ir pietiekama, lai analizētu parastās video straumes lidojuma laikā.

Avots: opennet.ru

Pievieno komentāru