ФаирМОТ, систем за брзо праћење више објеката на видео снимку

Истраживачи са Мајкрософта и Универзитета Централне Кине развијена нова метода високих перформанси за праћење вишеструких објеката у видеу користећи технологије машинског учења - ФаирМОТ (Фаир Мулти-Објецт Трацкинг). Код са имплементацијом метода заснованом на Питорцх-у и обученим моделима објављено на ГитХуб-у.

Већина постојећих метода праћења објеката користи две фазе, од којих свака имплементира засебна неуронска мрежа. Прва фаза покреће модел за одређивање локације објеката од интереса, а друга фаза користи модел претраге асоцијација који се користи за поновну идентификацију објеката и причвршћивање сидра за њих.

ФаирМОТ користи једностепену имплементацију засновану на деформабилној конволуционој неуронској мрежи (ДЦНв2, Деформабилна конволуциона мрежа), што вам омогућава да постигнете приметно повећање брзине праћења објеката. ФаирМОТ ради без сидра, користећи механизам поновне идентификације за одређивање помака центара објеката на мапи објеката високе прецизности. Паралелно, извршава се процесор који процењује појединачне карактеристике објеката који се могу користити за предвиђање њиховог идентитета, а главни модул врши конвергенцију ових карактеристика да би манипулисао објектима различитих размера.

ФаирМОТ, систем за брзо праћење више објеката на видео снимку

За обуку модела у ФаирМОТ-у коришћена је комбинација шест јавних скупова података за откривање и претрагу људи (ЕТХ, ЦитиПерсон, ЦалТецх, МОТ17, ЦУХК-СИСУ). Модел је тестиран коришћењем тестних сетова видео записа 2ДМОТ15, МОТ16, МОТ17 и МОТ20предвиђено пројектом МОТ Цхалленге и покрива различите ситуације, кретање или ротацију камере, различите углове гледања. Тестирање је то показало
ФаирМОТ надмашује најбржи конкурентски модели ТрацкРЦНН и ЈДЕ када се тестира на видео стримовима од 30 кадрова у секунди, показујући перформансе довољне за анализу редовних видео токова у ходу.

Извор: опеннет.ру

Додај коментар