FairMOT, järjestelmä useiden kohteiden nopeaan seurantaan videolla

Tutkijat Microsoftista ja Keski-Kiinan yliopistosta kehitetty uusi tehokas menetelmä useiden objektien seuraamiseen videossa käyttämällä koneoppimistekniikoita - FairMOT (Fair Multi-Object Tracking). Koodi menetelmän toteutuksella Pytorchiin ja koulutettuihin malleihin perustuen julkaistu GitHubissa.

Useimmat olemassa olevat objektien seurantamenetelmät käyttävät kahta vaihetta, joista kukin on toteutettu erillisellä neuroverkolla. Ensimmäisessä vaiheessa ajetaan malli kiinnostavien kohteiden sijainnin määrittämiseksi, ja toisessa vaiheessa käytetään assosiaatiohakumallia, jolla objektit tunnistetaan uudelleen ja ankkurit kiinnitetään niihin.

FairMOT käyttää yksivaiheista toteutusta, joka perustuu deformoituvaan konvoluutiohermoverkkoon (DCNv2, Deformable Convolutional Network), jonka avulla voit saavuttaa huomattavan lisäyksen kohteen seurannan nopeudessa. FairMOT toimii ilman ankkureita ja käyttää uudelleentunnistusmekanismia objektien keskipisteiden siirtymien määrittämiseen erittäin tarkalla kohdekartalla. Samanaikaisesti suoritetaan prosessori, joka arvioi objektien yksittäiset ominaisuudet, joiden avulla voidaan ennustaa niiden identiteetti, ja päämoduuli suorittaa näiden ominaisuuksien konvergenssin manipuloidakseen eri mittakaavaisia ​​objekteja.

FairMOT, järjestelmä useiden kohteiden nopeaan seurantaan videolla

Mallin kouluttamiseen FairMOTissa käytettiin kuuden julkisen tietojoukon yhdistelmää ihmisten havaitsemiseen ja etsimiseen (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Mallia testattiin käyttämällä videotestisarjoja 2DMOT15, MOT16, MOT17 и MOT20hankkeen tarjoama MOT-haaste ja kattaa erilaisia ​​tilanteita, kameran liikettä tai pyörimistä, erilaisia ​​katselukulmia. Testi osoitti sen
FairMOT ylittää nopeimmin kilpailevia malleja Seuraa RCNN и J.D.E. testattaessa 30 ruutua sekunnissa videovirralla, mikä osoittaa suorituskykyä, joka riittää analysoimaan tavallisia videovirtoja lennossa.

Lähde: opennet.ru

Lisää kommentti