FairMOT, sistemo por rapide spuri plurajn objektojn en video

Esploristoj de Microsoft kaj Centra Ĉina Universitato evoluinta nova alt-efikeca metodo por spuri plurajn objektojn en video uzante maŝinlernajn teknologiojn - FairMOT (Fair Multi-Object Tracking). Kodo kun metodo efektivigo bazita sur Pytorch kaj trejnitaj modeloj eldonita sur GitHub.

La plej multaj ekzistantaj objektspuraj metodoj uzas du stadiojn, ĉiu efektivigite per aparta neŭrala reto. La unua fazo prizorgas modelon por determinado de la loko de objektoj de intereso, kaj la dua etapo uzas asocian serĉmodelon uzitan por re-identigi objektojn kaj alkroĉi ankrojn al ili.

FairMOT uzas unufazan efektivigon bazitan sur deformebla konvolucia neŭrala reto (DCNv2, Deformable Convolutional Network), kiu ebligas al vi atingi rimarkindan pliiĝon en la rapideco de objektospurado. FairMOT funkcias sen ankroj, uzante re-identigmekanismon por determini la ofsetojn de objektocentroj en altpreciza objektomapo. Paralele, procesoro estas ekzekutita kiu taksas la individuajn trajtojn de objektoj kiuj povas esti uzitaj por antaŭdiri ilian identecon, kaj la ĉefmodulo elfaras konverĝon de tiuj trajtoj por manipuli objektojn de malsamaj skaloj.

FairMOT, sistemo por rapide spuri plurajn objektojn en video

Por trejni la modelon en FairMOT, kombinaĵo de ses publikaj datumaroj por homoj-detekto kaj serĉo estis uzita (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). La modelo estis testita per testaro de videoj 2DMOT15, MOT16, MOT17 и MOT20provizita de la projekto MOT Defio kaj kovrante malsamajn situaciojn, fotila movado aŭ rotacio, malsamaj rigardaj anguloj. La provoj montris tion
FairMOT eliras plej rapidaj konkurantaj modeloj TrackRCNN и J.D.E. kiam provite sur 30 kadroj sekundaj videofluoj, pruvante efikecon sufiĉan analizi regulajn videofluojn sur la muŝo.

fonto: opennet.ru

Aldoni komenton