FairMOT, видеодогу бир нече объекттерге тез көз салуу системасы

Microsoft жана Борбордук Кытай университетинин изилдөөчүлөрү иштелип чыккан машинаны үйрөнүү технологияларын колдонуу менен видеодо бир нече объекттерге көз салуу үчүн жаңы жогорку натыйжалуу ыкма - FairMOT (Fair Multi-Object Tracking). Pytorch жана үйрөтүлгөн моделдерге негизделген методду ишке ашыруу менен код жарыяланган GitHub боюнча.

Объектке көз салуу ыкмаларынын көбү эки этапты колдонушат, алардын ар бири өзүнчө нейрондук тармак тарабынан ишке ашырылат. Биринчи этапта кызыккан объектилердин жайгашкан жерин аныктоо модели иштейт, ал эми экинчи этапта объекттерди кайра идентификациялоо жана аларга анкерлерди бекитүү үчүн колдонулган ассоциация издөө модели колдонулат.

FairMOT деформациялануучу конволюциялык нейрон тармагына негизделген бир этаптуу ишке ашырууну колдонот (DCNv2, Deformable Convolutional Network), бул объектти көзөмөлдөө ылдамдыгын байкалаарлык жогорулатууга жетишүүгө мүмкүндүк берет. FairMOT жогорку тактыктагы объект картасында объектилердин борборлорунун жылыштарын аныктоо үчүн кайра идентификациялоо механизмин колдонуп, анкерсиз иштейт. Параллелдүү процессор аткарылат, ал объекттердин индивидуалдуулугун болжолдоо үчүн колдонулушу мүмкүн болгон жеке өзгөчөлүктөрүн баалоочу, ал эми негизги модулда ар кандай масштабдагы объектилерди манипуляциялоо үчүн бул функциялардын конвергенциясы аткарылат.

FairMOT, видеодогу бир нече объекттерге тез көз салуу системасы

FairMOT моделин окутуу үчүн, адамдарды аныктоо жана издөө үчүн алты коомдук маалымат топтомунун айкалышы колдонулган (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Модель видеолордун тесттик топтомдорун колдонуу менен сыналган 2DMOT15, MOT16, MOT17 и MOT20долбоор тарабынан каралган MOT Challenge жана ар кандай кырдаалдарды, камеранын кыймылын же айлануусун, ар кандай көрүү бурчтарын камтыйт. Муну тестирлөө көрсөттү
FairMOT озуп кетти тез атаандашкан моделдер TrackRCNN и J.D.E. секундасына 30 кадрдык видео агымдарда сыналганда, үзгүлтүксүз видео агымдарды тез арада талдоо үчүн жетиштүү өндүрүмдүүлүктү көрсөтөт.

Source: opennet.ru

Комментарий кошуу