U toku naših aktivnosti svakodnevno se suočavamo sa problemom određivanja prioriteta razvoja. S obzirom na visoku dinamiku razvoja IT industrije, stalno rastuću potražnju privrede i države za novim tehnologijama, svaki put kada odredimo vektor razvoja i uložimo vlastite snage i sredstva u naučni potencijal naše kompanije, vodimo računa da sva naša istraživanja i projekti su fundamentalne i interdisciplinarne prirode.
Stoga, razvojem naše glavne tehnologije - okvira za prepoznavanje podataka HIJEROGIFA, brinemo kako za poboljšanje kvaliteta prepoznavanja dokumenata (naša glavna poslovna linija) tako i za mogućnost korištenja tehnologije za rješavanje povezanih problema prepoznavanja. U današnjem članku ćemo vam reći kako smo na osnovu našeg mehanizma za prepoznavanje (dokumenata) napravili prepoznavanje većih, strateški važnih objekata u video streamu.
Izjava o problemu
Koristeći postojeće razvoje, izgraditi sistem za prepoznavanje rezervoara koji omogućava klasifikaciju objekta, kao i određivanje osnovnih geometrijskih indikatora (orijentacija i udaljenost) u loše kontrolisanim uslovima bez upotrebe specijalizovane opreme.
odluka
Kao glavni algoritam za rješavanje problema odabrali smo pristup statističkog mašinskog učenja. Ali jedan od ključnih problema mašinskog učenja je potreba za dovoljnom količinom podataka za obuku. Očigledno, prirodne slike dobijene iz stvarnih scena koje sadrže objekte koji su nam potrebni nisu nam dostupne. Stoga je odlučeno da se pribjegne generiranju potrebnih podataka za obuku, na sreću
Ciljani objekti su bila 4 modela borbenih tenkova: T-90 (Rusija), M1A2 Abrams (SAD), T-14 (Rusija), Merkava III (Izrael). Objekti su se nalazili na različitim pozicijama poligona, čime je proširena lista prihvatljivih vidljivih uglova objekta. Inženjerske barijere, drveće, žbunje i drugi pejzažni elementi igrali su značajnu ulogu.
Tako smo za par dana prikupili dovoljan set za obuku i naknadnu procjenu kvaliteta algoritma (nekoliko desetina hiljada slika).
Odlučili su da podijele samo prepoznavanje na dva dijela: lokalizaciju objekata i klasifikaciju objekata. Lokalizacija je izvršena pomoću obučenog klasifikatora Viole i Jonesa (na kraju krajeva, tenk je normalan kruti objekt, ništa gori od lica, tako da metoda Viole i Jonesa "slijepi od detalja" brzo lokalizira ciljni objekt). No, klasifikaciju i određivanje ugla povjerili smo konvolucionoj neuronskoj mreži - u ovom zadatku nam je važno da detektor uspješno identificira one karakteristike koje, recimo, razlikuju T-90 od Merkave. Kao rezultat toga, bilo je moguće konstruisati efikasan sastav algoritama koji uspješno rješava problem lokalizacije i klasifikacije objekata istog tipa.
Zatim smo pokrenuli rezultirajući program na svim našim postojećim platformama (Intel, ARM, Elbrus, Baikal, KOMDIV), optimizirali računski teške algoritme za povećanje performansi (o tome smo već pisali nekoliko puta u našim člancima, npr. ovdje
Kao rezultat svih opisanih radnji, dobili smo punopravni softverski proizvod sa značajnim taktičkim i tehničkim karakteristikama.
Pametni čitač rezervoara
Dakle, predstavljamo vam naš novi razvoj - program za prepoznavanje slika tenkova u video streamu Pametni čitač rezervoara, koji:
- Rješava problem “prijatelja ili neprijatelja” za dati skup objekata u realnom vremenu;
- Određuje geometrijske parametre (udaljenost do objekta, preferirana orijentacija objekta);
- Radi u nekontrolisanim vremenskim uslovima, kao iu slučaju delimičnog blokiranja objekta stranim predmetima;
- Potpuno autonoman rad na ciljnom uređaju, uključujući i odsustvo radio komunikacije;
- Lista podržanih arhitektura procesora: Elbrus, Baikal, KOMDIV, kao i x86, x86_64, ARM;
- Lista podržanih operativnih sistema: Elbrus OS, AstraLinux OS, Atlix OS, kao i MS Windows, macOS, razne Linux distribucije koje podržavaju gcc 4.8, Android, iOS;
- Potpuno domaći razvoj.
Obično, u zaključku naših članaka na Habré-u, dajemo vezu do tržišta, gdje svako ko koristi svoj mobilni telefon može preuzeti demo verziju aplikacije kako bi stvarno procijenio performanse tehnologije. Ovoga puta, uzimajući u obzir specifičnosti rezultirajuće aplikacije, želimo svim našim čitateljima da se nikada u životu ne susreću s problemom brzog utvrđivanja pripada li tenk određenoj strani.
izvor: www.habr.com