FairMOT, systém pro rychlé sledování více objektů na videu

Výzkumníci z Microsoftu a Central China University se vyvinuly nová vysoce výkonná metoda pro sledování více objektů ve videu pomocí technologií strojového učení – FairMOT (Fair Multi-Object Tracking). Kód s implementací metody založené na Pytorch a trénovaných modelech zveřejněno na GitHubu.

Většina existujících metod sledování objektů používá dvě fáze, z nichž každá je implementována samostatnou neuronovou sítí. V první fázi se spouští model pro určování polohy objektů zájmu a ve druhé fázi se používá model vyhledávání přidružení, který se používá k opětovné identifikaci objektů a připojení kotev k nim.

FairMOT využívá jednostupňovou implementaci založenou na deformovatelné konvoluční neuronové síti (DCNv2, Deformable Convolutional Network), která umožňuje dosáhnout znatelného zvýšení rychlosti sledování objektů. FairMOT funguje bez kotev, pomocí mechanismu opětovné identifikace k určení offsetů středů objektů na vysoce přesné mapě objektů. Paralelně je spuštěn procesor, který vyhodnocuje jednotlivé vlastnosti objektů, které lze použít k predikci jejich identity, a hlavní modul provádí konvergenci těchto vlastností pro manipulaci s objekty různých měřítek.

FairMOT, systém pro rychlé sledování více objektů na videu

K trénování modelu ve FairMOT byla použita kombinace šesti veřejných datových sad pro detekci a vyhledávání osob (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model byl testován pomocí testovacích sad videí 2DMOT15, STK16, STK17 и STK20poskytuje projekt Výzva STK a pokrývající různé situace, pohyb nebo otáčení kamery, různé úhly pohledu. Testování to ukázalo
FairMOT předstihuje nejrychlejší konkurenční modely TrackRCNN и J.D.E. při testování na video streamech s rychlostí 30 snímků za sekundu prokázal výkon dostatečný k analýze běžných video streamů za chodu.

Zdroj: opennet.ru

Přidat komentář