Výskumníci z Microsoftu a Central China University nová vysokovýkonná metóda sledovania viacerých objektov vo videu pomocou technológií strojového učenia – FairMOT (Fair Multi-Object Tracking). Kód s implementáciou metódy založenej na Pytorch a trénovaných modeloch na GitHub.
Väčšina existujúcich metód sledovania objektov využíva dve fázy, z ktorých každá je implementovaná samostatnou neurónovou sieťou. V prvej fáze je spustený model na určenie polohy objektov záujmu a v druhej fáze sa používa model vyhľadávania asociácií, ktorý sa používa na opätovnú identifikáciu objektov a pripojenie k nim kotvy.
FairMOT využíva jednostupňovú implementáciu založenú na deformovateľnej konvolučnej neurónovej sieti (, Deformable Convolutional Network), ktorá vám umožňuje dosiahnuť výrazné zvýšenie rýchlosti sledovania objektov. FairMOT funguje bez kotiev a využíva mechanizmus opätovnej identifikácie na určenie odsadenia stredov objektov na mape objektov s vysokou presnosťou. Paralelne sa vykonáva procesor, ktorý vyhodnocuje jednotlivé vlastnosti objektov, ktoré možno použiť na predpovedanie ich identity, a hlavný modul vykonáva konvergenciu týchto funkcií na manipuláciu s objektmi rôznych mier.

Na trénovanie modelu vo FairMOT bola použitá kombinácia šiestich verejných dátových súborov na detekciu a vyhľadávanie osôb (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model bol testovaný pomocou testovacích súborov videí , , и poskytuje projekt a pokrytie rôznych situácií, pohybu alebo otáčania kamery, rôznych uhlov pohľadu. Testovanie to ukázalo
FairMOT najrýchlejšie konkurenčné modely и pri testovaní na video streamoch s rýchlosťou 30 snímok za sekundu, čo demonštruje výkon dostatočný na analýzu bežných video streamov za behu.
Zdroj: opennet.ru
