FairMOT, sistem za brzo praćenje više objekata na videu

Istraživači sa Microsofta i Univerziteta Centralne Kine su se razvile nova metoda visokih performansi za praćenje više objekata u videu koristeći tehnologije mašinskog učenja - FairMOT (Fair Multi-Object Tracking). Kod sa implementacijom metode zasnovanom na Pytorchu i obučenim modelima objavljeno na GitHubu.

Većina postojećih metoda praćenja objekata koristi dvije faze, od kojih svaka implementira zasebna neuronska mreža. Prva faza pokreće model za određivanje lokacije objekata od interesa, a druga faza koristi model pretraživanja asocijacija koji se koristi za ponovnu identifikaciju objekata i pričvršćivanje sidra na njih.

FairMOT koristi jednostepenu implementaciju zasnovanu na deformabilnoj konvolucionoj neuronskoj mreži (DCNv2, Deformabilna konvoluciona mreža), što vam omogućava da postignete primjetno povećanje brzine praćenja objekata. FairMOT radi bez sidara, koristeći mehanizam ponovne identifikacije za određivanje pomaka centara objekata na mapi objekata visoke preciznosti. Paralelno, izvršava se procesor koji procjenjuje pojedinačne karakteristike objekata koji se mogu koristiti za predviđanje njihovog identiteta, a glavni modul vrši konvergenciju ovih karakteristika kako bi manipulirao objektima različitih razmjera.

FairMOT, sistem za brzo praćenje više objekata na videu

Za obuku modela u FairMOT-u korištena je kombinacija šest javnih skupova podataka za otkrivanje i pretragu ljudi (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model je testiran korištenjem testnih setova video zapisa 2DMOT15, MOT16, MOT17 и MOT20predviđeno projektom MOT Challenge i pokriva različite situacije, kretanje ili rotaciju kamere, različite uglove gledanja. Testiranje je to pokazalo
FairMOT nadmašuje najbrži konkurentski modeli TrackRCNN и J.D.E. kada se testira na video streamovima od 30 sličica u sekundi, pokazujući performanse dovoljne za analizu redovnih video tokova u hodu.

izvor: opennet.ru

Dodajte komentar