FairMOT, systém na rýchle sledovanie viacerých objektov na videu

Výskumníci z Microsoftu a Central China University vyvinuté nová vysokovýkonná metóda sledovania viacerých objektov vo videu pomocou technológií strojového učenia – FairMOT (Fair Multi-Object Tracking). Kód s implementáciou metódy založenej na Pytorch a trénovaných modeloch publikovaný na GitHub.

Väčšina existujúcich metód sledovania objektov využíva dve fázy, z ktorých každá je implementovaná samostatnou neurónovou sieťou. V prvej fáze je spustený model na určenie polohy objektov záujmu a v druhej fáze sa používa model vyhľadávania asociácií, ktorý sa používa na opätovnú identifikáciu objektov a pripojenie k nim kotvy.

FairMOT využíva jednostupňovú implementáciu založenú na deformovateľnej konvolučnej neurónovej sieti (DCNv2, Deformable Convolutional Network), ktorá vám umožňuje dosiahnuť výrazné zvýšenie rýchlosti sledovania objektov. FairMOT funguje bez kotiev a využíva mechanizmus opätovnej identifikácie na určenie odsadenia stredov objektov na mape objektov s vysokou presnosťou. Paralelne sa vykonáva procesor, ktorý vyhodnocuje jednotlivé vlastnosti objektov, ktoré možno použiť na predpovedanie ich identity, a hlavný modul vykonáva konvergenciu týchto funkcií na manipuláciu s objektmi rôznych mier.

FairMOT, systém na rýchle sledovanie viacerých objektov na videu

Na trénovanie modelu vo FairMOT bola použitá kombinácia šiestich verejných dátových súborov na detekciu a vyhľadávanie osôb (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model bol testovaný pomocou testovacích súborov videí 2DMOT15, MOT16, MOT17 и MOT20poskytuje projekt Výzva STK a pokrytie rôznych situácií, pohybu alebo otáčania kamery, rôznych uhlov pohľadu. Testovanie to ukázalo
FairMOT predstihuje najrýchlejšie konkurenčné modely TrackRCNN и IDE pri testovaní na video streamoch s rýchlosťou 30 snímok za sekundu, čo demonštruje výkon dostatočný na analýzu bežných video streamov za behu.

Zdroj: opennet.ru

Pridať komentár