FairMOT, system ar gyfer olrhain gwrthrychau lluosog ar fideo yn gyflym

Ymchwilwyr o Microsoft a Phrifysgol Canol Tsieina wedi datblygu dull perfformiad uchel newydd ar gyfer olrhain gwrthrychau lluosog mewn fideo gan ddefnyddio technolegau dysgu peirianyddol - FairMOT (Fair Multi-Object Tracking). Côd gyda gweithredu dull yn seiliedig ar Pytorch a modelau hyfforddedig cyhoeddi ar GitHub.

Mae'r rhan fwyaf o ddulliau olrhain gwrthrychau presennol yn defnyddio dau gam, pob un yn cael ei weithredu gan rwydwaith niwral ar wahân. Mae'r cam cyntaf yn rhedeg model ar gyfer pennu lleoliad gwrthrychau o ddiddordeb, ac mae'r ail gam yn defnyddio model chwilio cysylltiad a ddefnyddir i ail-adnabod gwrthrychau ac atodi angorau iddynt.

Mae FairMOT yn defnyddio gweithrediad un cam yn seiliedig ar rwydwaith niwral troellol anffurfadwy (DCNv2, Rhwydwaith Convolutional Anffurfadwy), sy'n eich galluogi i gyflawni cynnydd amlwg yn y cyflymder olrhain gwrthrych. Mae FairMOT yn gweithio heb angorau, gan ddefnyddio mecanwaith ail-adnabod i bennu gwrthbwyso canolfannau gwrthrychau ar fap gwrthrych manwl uchel. Ar yr un pryd, gweithredir prosesydd sy'n gwerthuso nodweddion unigol gwrthrychau y gellir eu defnyddio i ragfynegi eu hunaniaeth, ac mae'r prif fodiwl yn cydgyfeirio'r nodweddion hyn i drin gwrthrychau o wahanol raddfeydd.

FairMOT, system ar gyfer olrhain gwrthrychau lluosog ar fideo yn gyflym

I hyfforddi'r model yn FairMOT, defnyddiwyd cyfuniad o chwe set ddata gyhoeddus ar gyfer canfod a chwilio pobl (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Profwyd y model gan ddefnyddio setiau prawf o fideos 2DMOT15, MOT16, MOT17 и MOT20a ddarperir gan y prosiect Her MOT ac yn cwmpasu gwahanol sefyllfaoedd, symudiad camera neu gylchdroi, onglau gwylio gwahanol. Dangosodd y profion hynny
FairMOT brigiadau modelau sy'n cystadlu gyflymaf TracRCNN и Mae J.D.E. pan gaiff ei brofi ar ffrydiau fideo 30 ffrâm yr eiliad, gan ddangos perfformiad digonol i ddadansoddi ffrydiau fideo rheolaidd ar y hedfan.

Ffynhonnell: opennet.ru

Ychwanegu sylw