FairMOT, sistem kanggo cepet nelusuri macem-macem obyek ing video

Peneliti saka Microsoft lan Central China University dikembangke cara kinerja dhuwur anyar kanggo nelusuri macem-macem obyek ing video nggunakake teknologi machine learning - FairMOT (Fair Multi-Object Tracking). Kode kanthi implementasine metode adhedhasar Pytorch lan model sing dilatih diterbitake ing GitHub.

Umume metode pelacakan obyek sing ana nggunakake rong tahap, saben diimplementasikake dening jaringan saraf sing kapisah. Tahap pisanan nglakokake model kanggo nemtokake lokasi obyek sing dikarepake, lan tahap kapindho nggunakake model telusuran asosiasi sing digunakake kanggo ngenali maneh obyek lan masang jangkar.

FairMOT nggunakake implementasi siji-tahap adhedhasar jaringan saraf convolutional deformable (DCNv2, Deformable Convolutional Network), sing ngidini sampeyan entuk peningkatan sing nyata ing kacepetan pelacakan obyek. FairMOT dianggo tanpa jangkar, nggunakake mekanisme re-identifikasi kanggo nemtokake offset pusat obyek ing peta obyek tliti dhuwur. Ing podo karo, prosesor dieksekusi sing ngevaluasi fitur individu obyek sing bisa digunakake kanggo prédhiksi identitas, lan modul utama nindakake konvergensi fitur iki kanggo ngapusi obyek saka ukuran beda.

FairMOT, sistem kanggo cepet nelusuri macem-macem obyek ing video

Kanggo nglatih model ing FairMOT, kombinasi enem dataset umum kanggo deteksi lan panelusuran wong digunakake (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model kasebut diuji nggunakake set tes video 2DMOT15, MOT16, MOT17 и MOT20diwenehake dening proyek Tantangan MOT lan nutupi kahanan sing beda, gerakan utawa rotasi kamera, sudut pandang sing beda. Pengujian kasebut nuduhake
FairMOT ngungkuli model saingan paling cepet TrackRCNN и J.D.E. nalika dites ing 30 pigura per detik video stream, nuduhake kinerja cukup kanggo njelasno stream video biasa ing fly.

Source: opennet.ru

Add a comment