FairMOT, et system for rask sporing av flere objekter på video

Forskere fra Microsoft og Central China University utviklet en ny høyytelsesmetode for sporing av flere objekter i video ved hjelp av maskinlæringsteknologier - FairMOT (Fair Multi-Object Tracking). Kode med metodeimplementering basert på Pytorch og trente modeller publisert på GitHub.

De fleste eksisterende objektsporingsmetoder bruker to trinn, hver implementert av et eget nevralt nettverk. Det første trinnet kjører en modell for å bestemme plasseringen av objekter av interesse, og det andre trinnet bruker en assosiasjonssøkemodell som brukes til å re-identifisere objekter og feste ankere til dem.

FairMOT bruker en ett-trinns implementering basert på et deformerbart konvolusjonelt nevralt nettverk (DCNv2, Deformerable Convolutional Network), som lar deg oppnå en merkbar økning i hastigheten på objektsporing. FairMOT fungerer uten ankere, ved å bruke en re-identifikasjonsmekanisme for å bestemme forskyvningen av objektsentre på et objektkart med høy presisjon. Parallelt kjøres det en prosessor som evaluerer de individuelle egenskapene til objekter som kan brukes til å forutsi deres identitet, og hovedmodulen utfører en konvergens av disse funksjonene for å manipulere objekter av forskjellige skalaer.

FairMOT, et system for rask sporing av flere objekter på video

For å trene modellen i FairMOT ble en kombinasjon av seks offentlige datasett for persondeteksjon og søk brukt (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Modellen ble testet ved hjelp av testsett med videoer 2DMOT15, MOT16, MOT17 и MOT20levert av prosjektet MOT utfordring og dekker forskjellige situasjoner, kamerabevegelse eller rotasjon, forskjellige synsvinkler. Testingen viste det
FairMOT overskridelser de raskeste konkurrerende modellene SporRCNN и J.D.E. når testet på 30 bilder per sekund videostrømmer, demonstrerer ytelsen tilstrekkelig til å analysere vanlige videostrømmer på farten.

Kilde: opennet.ru

Legg til en kommentar