Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

У працэсе сваёй дзейнасці мы штодзённа сутыкаемся з праблемай вызначэння прыярытэтаў развіцця. Улічваючы высокую дынаміку развіцця IT індустрыі, пастаянна ўзрастаючую запатрабаванасць з боку бізнесу і дзяржавы да новых тэхналогій, кожны раз, вызначаючы вектар развіцця і інвесціруючы ўласныя сілы і сродкі ў навуковы патэнцыял нашай кампаніі, мы сочым за тым, каб усе нашы даследаванні і праекты насілі фундаментальны і міждысцыплінарны характар.

Таму, развіваючы нашу галоўную тэхналогію - фрэймворк распазнання дадзеных HIEROGLYPH, мы клапоцімся як аб павышэнні якасці распазнання дакументаў (наша асноўная бізнес-лінія), так і магчымасці прымянення тэхналогіі для вырашэння сумежных задач распазнання. У сённяшнім артыкуле мы распавядзем, як на базе нашага рухавічка распазнання (дакументаў), мы зрабілі распазнанне буйнейшых, стратэгічна важных аб'ектаў у відэаструмені.

Пастаноўка задачы

Выкарыстоўваючы існуючыя напрацоўкі пабудаваць сістэму распазнавання танкаў, якая дазваляе праводзіць класіфікацыю аб'екта, а таксама вызначаць базавыя геаметрычныя паказчыкі (арыентацыю і адлегласць) у слабакантраляваных умовах без выкарыстання спецыялізаванага абсталявання.

рашэнне

У якасці асноўнага алгарытму пры рашэнні задачы мы выбралі падыход статыстычнага машыннага навучання. Але адной з ключавых праблем машыннага навучання, з'яўляецца неабходнасць наяўнасці дастатковай колькасці навучэнцаў дадзеных. Відавочна, што натуральныя выявы, атрыманыя з рэальных сцэн, якія змяшчаюць неабходныя нам аб'екты, нам недаступныя. Таму было вырашана звярнуцца да генерацыі неабходных дадзеных для навучання, балазе вопыт у гэтым месцы ў нас вялікі. І ўсё ж, цалкам сінтэзаваць дадзеныя для дадзенай задачы нам падалося ненатуральным, таму для мадэлявання рэальных сцэн быў падрыхтаваны спецыяльны макет. На макеце ўстаноўлены розныя аб'екты, якія мадэлююць сельскую мясцовасць: характэрнае ландшафтнае пакрыццё, кусты, дрэвы, загароды і г.д. Выявы захопліваліся з дапамогай лічбавай малафарматнай камеры. У працэсе захопу малюнка істотна мяняўся задні план сцэны для забеспячэння большай устойлівасці алгарытмаў да змен фону.

Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

У якасці мэтавых аб'ектаў выступалі 4 мадэлі баявых танкаў: Т-90 (Расія), М1А2 Абрамс (ЗША), Т-14 (Расія), Меркава III (Ізраіль). Аб'екты размяшчаліся на розных пазіцыях палігона, тым самым пашыраючы спіс дапушчальных бачных ракурсаў аб'екта. Значную ролю адыгралі інжынерныя загароды, дрэвы, кусты і іншыя ландшафтныя элементы.

Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

Такім чынам, за пару дзён мы сабралі дастатковы набор для навучання і наступнай адзнакі якасці працы алгарытму (некалькі дзясяткаў тысяч малюнкаў).

Непасрэдна распазнанне вырашылі разбіць на дзве часткі: лакалізацыя аб'екта і класіфікацыя аб'екта. Лакалізацыя выконвалася з дапамогай навучанага класіфікатара Віёлы і Джонса (усёткі танк – гэта нармальны рыгідны аб'ект, нічым не горшы за твар, таму "слепаваты на дэталі" метад Віёлы і Джонса хутка лакалізуе мэтавы аб'ект). А вось класіфікацыю і вызначэнне ракурсу мы даверылі скруткавай нейронавай сеткі – у гэтай задачы нам важна, каб дэтэктар паспяхова вылучаў тыя асаблівасці, якія, скажам адрозніваюць Т-90 ад Меркавы. У выніку ўдалося пабудаваць эфектыўную кампазіцыю алгарытмаў, паспяхова вырашальную задачу лакалізацыі і класіфікацыі аднатыпных аб'ектаў.

Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

Далей, мы запусцілі атрыманую праграму на ўсіх наяўных у нас платформах (Intel, ARM, Эльбрус, Байкал, Камдзіў), аптымізавалі вылічальна-цяжкія алгарытмы для павышэння хуткадзейнасці (пра гэта мы ўжо неаднаразова пісалі ў сваіх артыкулах, напрыклад тут https://habr.com/ru/company/smartengines/blog/438948/ або https://habr.com/ru/company/smartengines/blog/351134/) і дабіліся ўстойлівай працы праграмы на прыладзе ў рэжыме рэальнага часу.


У выніку правядзенні ўсіх апісаных дзеянняў у нас атрымаўся паўнавартасны праграмны прадукт, які валодае істотнымі тактыка-тэхнічнымі характарыстыкамі.

Smart Tank Reader

Такім чынам, прадстаўляем вам нашу новую распрацоўку - праграму для распазнання выяў танкаў у відэаструмені. Smart Tank Reader, якая:

Распазнаванне танкаў у відэаструмені метадамі машыннага навучання (+2 відэа на платформах Эльбрус і Байкал)

  • Вырашае задачу "свой-чужы" для зададзенага набору аб'ектаў у рэжыме рэальнага часу;
  • Вызначае геаметрычныя паказчыкі (адлегласць да аб'екта, пераважная арыентацыя аб'екта);
  • Працуе ў некантралюемых умовах надвор'я, а таксама ў выпадку частковага перакрыцця аб'екта староннімі аб'ектамі;
  • Цалкам аўтаномная праца на мэтавай прыладзе, у тым ліку ва ўмовах адсутнасці радыёсувязі;
  • Спіс падтрымліваемых працэсарных архітэктур: Эльбрус, Байкал, Камдзіў, а таксама x86, x86_64, ARM;
  • Спіс падтрымліваемых аперацыйных сістэм: АС Эльбрус, АС AstraLinux, АС Атлікс, а таксама MS Windows, macOS, розныя дыстрыбутывы Linux, якія падтрымліваюць gcc 4.8, Android, iOS;
  • Цалкам айчынная распрацоўка.

Звычайна ў зняволенні да сваіх артыкулаў на Хабры мы даем спасылку на маркетплейс, дзе кожны жадаючы з дапамогай свайго мабільнага тэлефона можа спампаваць дэманстрацыйную версію прыкладання, каб на справе ацаніць працаздольнасць тэхналогіі. У гэты раз, улічваючы спецыфіку атрыманага прыкладання, мы жадаем усім нашым чытачам ніколі не ў жыцці сутыкацца праблемай аператыўнага вызначэння прыналежнасці танка да вызначанага боку.

Крыніца: habr.com

Дадаць каментар