FairMOT, sistem za hitro sledenje več objektov na videu

Raziskovalci iz Microsofta in Central China University razviti nova visoko zmogljiva metoda za sledenje več objektom v videu s pomočjo tehnologij strojnega učenja – FairMOT (Fair Multi-Object Tracking). Koda z implementacijo metode, ki temelji na Pytorchu in usposobljenih modelih objavljeno na GitHubu.

Večina obstoječih metod sledenja objektom uporablja dve stopnji, od katerih vsako izvaja ločena nevronska mreža. Prva stopnja izvaja model za določanje lokacije zanimivih predmetov, druga stopnja pa uporablja asociacijski iskalni model, ki se uporablja za ponovno identifikacijo predmetov in pripenjanje sider nanje.

FairMOT uporablja enostopenjsko izvedbo, ki temelji na deformabilni konvolucijski nevronski mreži (DCNv2, Deformable Convolutional Network), ki vam omogoča, da dosežete opazno povečanje hitrosti sledenja objektom. FairMOT deluje brez sider in uporablja mehanizem ponovne identifikacije za določanje odmikov središč objektov na zemljevidu objektov z visoko natančnostjo. Vzporedno se izvaja procesor, ki ovrednoti posamezne lastnosti objektov, ki jih je mogoče uporabiti za predvidevanje njihove identitete, glavni modul pa izvede konvergenco teh lastnosti za manipulacijo objektov različnih lestvic.

FairMOT, sistem za hitro sledenje več objektov na videu

Za usposabljanje modela v FairMOT je bila uporabljena kombinacija šestih javnih naborov podatkov za odkrivanje in iskanje ljudi (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model je bil preizkušen s testnimi nizi videoposnetkov 2DMOT15, MOT16, MOT17 и MOT20ki jih zagotavlja projekt MOT izziv in zajema različne situacije, gibanje ali vrtenje kamere, različne kote gledanja. To je pokazalo testiranje
FairMOT presega najhitrejši konkurenčni modeli TrackRCNN и J.D.E. pri testiranju na video tokovih s hitrostjo 30 sličic na sekundo, kar dokazuje zmogljivost, ki zadostuje za sprotno analizo rednih video tokov.

Vir: opennet.ru

Dodaj komentar