Ang FairMOT, usa ka sistema alang sa dali nga pagsubay sa daghang mga butang sa video

Mga tigdukiduki gikan sa Microsoft ug Central China University naugmad usa ka bag-ong pamaagi sa high-performance alang sa pagsubay sa daghang mga butang sa video gamit ang mga teknolohiya sa pagkat-on sa makina - FairMOT (Fair Multi-Object Tracking). Code nga adunay pamaagi nga pagpatuman base sa Pytorch ug nabansay nga mga modelo gimantala sa GitHub.

Kadaghanan sa kasamtangan nga mga pamaagi sa pagsubay sa butang naggamit sa duha ka yugto, ang matag usa gipatuman sa usa ka bulag nga neural network. Ang una nga yugto nagpadagan sa usa ka modelo alang sa pagtino sa lokasyon sa mga butang nga interesado, ug ang ikaduha nga yugto naggamit usa ka modelo sa pagpangita sa asosasyon nga gigamit aron mailhan pag-usab ang mga butang ug ilakip ang mga angkla niini.

Ang FairMOT naggamit sa usa ka yugto nga pagpatuman base sa usa ka deformable convolutional neural network (DCNv2, Deformable Convolutional Network), nga nagtugot kanimo nga makab-ot ang usa ka mamatikdan nga pagtaas sa katulin sa pagsubay sa butang. Ang FairMOT nagtrabaho nga walay mga angkla, gamit ang mekanismo sa pag-ila pag-usab aron mahibal-an ang mga offset sa mga sentro sa butang sa usa ka high-precision nga mapa sa butang. Sa susama, ang usa ka processor gipatuman nga nagtimbang-timbang sa indibidwal nga mga bahin sa mga butang nga magamit sa pagtagna sa ilang pagkatawo, ug ang nag-unang module naghimo sa usa ka panagsama niini nga mga bahin aron sa pagmaniobra sa mga butang sa lain-laing mga timbangan.

Ang FairMOT, usa ka sistema alang sa dali nga pagsubay sa daghang mga butang sa video

Aron mabansay ang modelo sa FairMOT, usa ka kombinasyon sa unom ka publiko nga mga datasets alang sa pag-ila ug pagpangita sa mga tawo ang gigamit (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Gisulayan ang modelo gamit ang mga set sa pagsulay sa mga video 2DMOT15, MOT16, MOT17 ΠΈ MOT20gihatag sa proyekto MOT Challenge ug naglangkob sa lain-laing mga sitwasyon, camera kalihukan o rotation, lain-laing mga anggulo sa pagtan-aw. Gipakita kana sa pagsulay
FairMOT paggawas labing paspas nga kompetisyon nga mga modelo TrackRCNN ΠΈ JDE kung gisulayan sa 30 nga mga frame matag segundo nga mga sapa sa video, nagpakita nga igo ang pasundayag aron ma-analisar ang mga regular nga sapa sa video sa langaw.

Source: opennet.ru

Idugang sa usa ka comment