Raziskovalci iz Microsofta in Central China University Nova visokozmogljiva metoda za sledenje več objektom v videoposnetku z uporabo tehnologij strojnega učenja – FairMOT (Fair Multi-Object Tracking). Koda, ki implementira metodo v PyTorchu, in naučeni modeli na GitHubu.
Večina obstoječih metod sledenja objektom uporablja dve stopnji, vsako implementira ločena nevronska mreža. Prva stopnja implementira model za lociranje objektov, ki nas zanimajo, druga stopnja pa uporablja asociacijski model za ponovno identifikacijo objektov in dodelitev sider njim.
FairMOT uporablja enostopenjsko implementacijo, ki temelji na deformabilni konvolucijski nevronski mreži (FairMOT (Deformabilno konvolucijsko omrežje), ki znatno izboljša hitrost sledenja objektom. FairMOT deluje brez sider in uporablja mehanizem ponovne identifikacije za določanje odmikov središč objektov na visoko natančnem zemljevidu objektov. Vzporedni procesor ocenjuje posamezne značilnosti objektov, ki jih je mogoče uporabiti za napovedovanje njihove identitete, glavni modul pa te značilnosti združuje za manipulacijo objektov različnih meril.

Za učenje modela FairMOT je bila uporabljena kombinacija šestih javnih naborov podatkov za zaznavanje in iskanje ljudi (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model je bil preizkušen z uporabo validacijskih videoposnetkov. , , и ki ga zagotavlja projekt in zajema različne situacije, gibanje ali vrtenje kamere ter različne kote gledanja. Testiranje je pokazalo, da
FairMOT najhitrejši konkurenčni modeli и pri testiranju na video tokovih s 30 sličicami na sekundo je pokazala zmogljivost, ki zadostuje za analizo običajnih video tokov sproti.
Vir: opennet.ru
