FairMOT, videodagi bir nechta ob'ektlarni tezda kuzatish tizimi

Microsoft va Markaziy Xitoy universiteti tadqiqotchilari rivojlangan mashinani o'rganish texnologiyalaridan foydalangan holda videodagi bir nechta ob'ektlarni kuzatishning yangi yuqori samarali usuli - FairMOT (Fair Multi-Object Tracking). Pytorch va o'qitilgan modellarga asoslangan usulni amalga oshirish bilan kod nashr etilgan GitHub-da.

Mavjud ob'ektlarni kuzatish usullarining aksariyati ikkita bosqichdan foydalanadi, ularning har biri alohida neyron tarmoq tomonidan amalga oshiriladi. Birinchi bosqichda qiziqish ob'ektlarining joylashishini aniqlash modeli ishlaydi, ikkinchi bosqichda esa ob'ektlarni qayta identifikatsiyalash va ularga langarlarni biriktirish uchun foydalaniladigan assotsiatsiyalarni qidirish modeli qo'llaniladi.

FairMOT deformatsiyalanadigan konvolyutsion neyron tarmog'iga asoslangan bir bosqichli dasturdan foydalanadi (DCNv2, Deformatsiyalanuvchi konvolyutsion tarmoq), bu ob'ektni kuzatish tezligini sezilarli darajada oshirishga imkon beradi. FairMOT langarsiz ishlaydi, yuqori aniqlikdagi ob'ekt xaritasida ob'ekt markazlarining ofsetlarini aniqlash uchun qayta identifikatsiya mexanizmidan foydalanadi. Parallel ravishda, ularning shaxsini bashorat qilish uchun ishlatilishi mumkin bo'lgan ob'ektlarning individual xususiyatlarini baholovchi protsessor bajariladi va asosiy modul turli masshtabdagi ob'ektlarni manipulyatsiya qilish uchun ushbu xususiyatlarning konvergentsiyasini amalga oshiradi.

FairMOT, videodagi bir nechta ob'ektlarni tezda kuzatish tizimi

Modelni FairMOT-da o'qitish uchun odamlarni aniqlash va qidirish uchun oltita umumiy ma'lumotlar to'plamining kombinatsiyasi ishlatilgan (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model sinovdan o'tgan video to'plamlari yordamida sinovdan o'tkazildi 2DMOT15, MOT16, MOT17 и MOT20loyiha tomonidan taqdim etilgan MOT Challenge va turli vaziyatlarni, kamera harakati yoki aylanishini, turli ko'rish burchaklarini qamrab oladi. Sinov shuni ko'rsatdi
FairMOT ustunlar eng tez raqobatdosh modellar TrackRCNN и JDE sekundiga 30 kadrli video oqimlarida sinovdan o'tkazilganda, oddiy video oqimlarni tezda tahlil qilish uchun etarli ishlashni namoyish etadi.

Manba: opennet.ru

a Izoh qo'shish