У працэсе сваёй дзейнасці мы штодзённа сутыкаемся з праблемай вызначэння прыярытэтаў развіцця. Улічваючы высокую дынаміку развіцця IT індустрыі, пастаянна ўзрастаючую запатрабаванасць з боку бізнесу і дзяржавы да новых тэхналогій, кожны раз, вызначаючы вектар развіцця і інвесціруючы ўласныя сілы і сродкі ў навуковы патэнцыял нашай кампаніі, мы сочым за тым, каб усе нашы даследаванні і праекты насілі фундаментальны і міждысцыплінарны характар.
Таму, развіваючы нашу галоўную тэхналогію - фрэймворк распазнання дадзеных HIEROGLYPH, мы клапоцімся як аб павышэнні якасці распазнання дакументаў (наша асноўная бізнес-лінія), так і магчымасці прымянення тэхналогіі для вырашэння сумежных задач распазнання. У сённяшнім артыкуле мы распавядзем, як на базе нашага рухавічка распазнання (дакументаў), мы зрабілі распазнанне буйнейшых, стратэгічна важных аб'ектаў у відэаструмені.
Пастаноўка задачы
Выкарыстоўваючы існуючыя напрацоўкі пабудаваць сістэму распазнавання танкаў, якая дазваляе праводзіць класіфікацыю аб'екта, а таксама вызначаць базавыя геаметрычныя паказчыкі (арыентацыю і адлегласць) у слабакантраляваных умовах без выкарыстання спецыялізаванага абсталявання.
рашэнне
У якасці асноўнага алгарытму пры рашэнні задачы мы выбралі падыход статыстычнага машыннага навучання. Але адной з ключавых праблем машыннага навучання, з'яўляецца неабходнасць наяўнасці дастатковай колькасці навучэнцаў дадзеных. Відавочна, што натуральныя выявы, атрыманыя з рэальных сцэн, якія змяшчаюць неабходныя нам аб'екты, нам недаступныя. Таму было вырашана звярнуцца да генерацыі неабходных дадзеных для навучання, балазе
У якасці мэтавых аб'ектаў выступалі 4 мадэлі баявых танкаў: Т-90 (Расія), М1А2 Абрамс (ЗША), Т-14 (Расія), Меркава III (Ізраіль). Аб'екты размяшчаліся на розных пазіцыях палігона, тым самым пашыраючы спіс дапушчальных бачных ракурсаў аб'екта. Значную ролю адыгралі інжынерныя загароды, дрэвы, кусты і іншыя ландшафтныя элементы.
Такім чынам, за пару дзён мы сабралі дастатковы набор для навучання і наступнай адзнакі якасці працы алгарытму (некалькі дзясяткаў тысяч малюнкаў).
Непасрэдна распазнанне вырашылі разбіць на дзве часткі: лакалізацыя аб'екта і класіфікацыя аб'екта. Лакалізацыя выконвалася з дапамогай навучанага класіфікатара Віёлы і Джонса (усёткі танк – гэта нармальны рыгідны аб'ект, нічым не горшы за твар, таму "слепаваты на дэталі" метад Віёлы і Джонса хутка лакалізуе мэтавы аб'ект). А вось класіфікацыю і вызначэнне ракурсу мы даверылі скруткавай нейронавай сеткі – у гэтай задачы нам важна, каб дэтэктар паспяхова вылучаў тыя асаблівасці, якія, скажам адрозніваюць Т-90 ад Меркавы. У выніку ўдалося пабудаваць эфектыўную кампазіцыю алгарытмаў, паспяхова вырашальную задачу лакалізацыі і класіфікацыі аднатыпных аб'ектаў.
Далей, мы запусцілі атрыманую праграму на ўсіх наяўных у нас платформах (Intel, ARM, Эльбрус, Байкал, Камдзіў), аптымізавалі вылічальна-цяжкія алгарытмы для павышэння хуткадзейнасці (пра гэта мы ўжо неаднаразова пісалі ў сваіх артыкулах, напрыклад тут
У выніку правядзенні ўсіх апісаных дзеянняў у нас атрымаўся паўнавартасны праграмны прадукт, які валодае істотнымі тактыка-тэхнічнымі характарыстыкамі.
Smart Tank Reader
Такім чынам, прадстаўляем вам нашу новую распрацоўку - праграму для распазнання выяў танкаў у відэаструмені. Smart Tank Reader, якая:
- Вырашае задачу "свой-чужы" для зададзенага набору аб'ектаў у рэжыме рэальнага часу;
- Вызначае геаметрычныя паказчыкі (адлегласць да аб'екта, пераважная арыентацыя аб'екта);
- Працуе ў некантралюемых умовах надвор'я, а таксама ў выпадку частковага перакрыцця аб'екта староннімі аб'ектамі;
- Цалкам аўтаномная праца на мэтавай прыладзе, у тым ліку ва ўмовах адсутнасці радыёсувязі;
- Спіс падтрымліваемых працэсарных архітэктур: Эльбрус, Байкал, Камдзіў, а таксама x86, x86_64, ARM;
- Спіс падтрымліваемых аперацыйных сістэм: АС Эльбрус, АС AstraLinux, АС Атлікс, а таксама MS Windows, macOS, розныя дыстрыбутывы Linux, якія падтрымліваюць gcc 4.8, Android, iOS;
- Цалкам айчынная распрацоўка.
Звычайна ў зняволенні да сваіх артыкулаў на Хабры мы даем спасылку на маркетплейс, дзе кожны жадаючы з дапамогай свайго мабільнага тэлефона можа спампаваць дэманстрацыйную версію прыкладання, каб на справе ацаніць працаздольнасць тэхналогіі. У гэты раз, улічваючы спецыфіку атрыманага прыкладання, мы жадаем усім нашым чытачам ніколі не ў жыцці сутыкацца праблемай аператыўнага вызначэння прыналежнасці танка да вызначанага боку.
Крыніца: habr.com