FairMOT – sistema, skirta greitai sekti kelis objektus vaizdo įraše

Tyrėjai iš Microsoft ir Centrinės Kinijos universiteto išvystyta naujas didelio našumo metodas kelių objektų stebėjimui vaizdo įraše naudojant mašininio mokymosi technologijas – FairMOT (Fair Multi-Object Tracking). Kodas su metodo įgyvendinimu, pagrįstas Pytorch ir išmokytais modeliais paskelbta „GitHub“.

Dauguma esamų objektų sekimo metodų naudoja du etapus, kurių kiekvieną įgyvendina atskiras neuroninis tinklas. Pirmajame etape vykdomas dominančių objektų vietos nustatymo modelis, o antrajame etape naudojamas asociacijų paieškos modelis, naudojamas objektams pakartotinai identifikuoti ir prie jų pritvirtinti inkarus.

FairMOT naudoja vieno etapo įgyvendinimą, pagrįstą deformuojamu konvoliuciniu neuroniniu tinklu (DCNv2, Deformuojamas konvoliucinis tinklas), kuris leidžia pasiekti pastebimą objekto sekimo greičio padidėjimą. FairMOT veikia be inkarų, naudodamas pakartotinio identifikavimo mechanizmą, kad nustatytų objektų centrų poslinkius didelio tikslumo objektų žemėlapyje. Lygiagrečiai vykdomas procesorius, kuris įvertina atskiras objektų savybes, pagal kurias galima numatyti jų tapatybę, o pagrindinis modulis atlieka šių savybių konvergenciją, kad būtų galima manipuliuoti skirtingo mastelio objektais.

FairMOT – sistema, skirta greitai sekti kelis objektus vaizdo įraše

Norint išmokyti modelį FairMOT, buvo naudojamas šešių viešųjų duomenų rinkinių, skirtų žmonių aptikimui ir paieškai, derinys (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Modelis buvo išbandytas naudojant bandomuosius vaizdo įrašų rinkinius 2DMOT15, MOT16, MOT17 и MOT20numatyta projekto MOT iššūkis ir apimantis įvairias situacijas, kameros judėjimą ar sukimąsi, skirtingus žiūrėjimo kampus. Testas tai parodė
FairMOT lenkia greičiausi konkuruojantys modeliai TrackRCNN и J.D.E. Kai bandoma naudojant 30 kadrų per sekundę vaizdo įrašų srautus, rodomas našumas, pakankamas įprastiems vaizdo srautams analizuoti.

Šaltinis: opennet.ru

Добавить комментарий