Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

Under vår verksamhet står vi dagligen inför problemet med att bestämma utvecklingsprioriteringar. Med tanke på den höga dynamiken i utvecklingen av IT-branschen, den ständigt ökande efterfrågan från företag och myndigheter på ny teknik, varje gång vi bestämmer utvecklingsvektorn och investerar våra egna krafter och medel i vårt företags vetenskapliga potential, ser vi till att all vår forskning och alla projekt är av grundläggande och tvärvetenskaplig karaktär.

Därför, genom att utveckla vår huvudteknologi - HIEROGLYPH dataigenkänningsramverket, är vi oroade över både att förbättra kvaliteten på dokumentigenkänning (vår huvudsakliga affärslinje) och möjligheten att använda tekniken för att lösa relaterade igenkänningsproblem. I dagens artikel kommer vi att berätta hur vi, baserat på vår igenkänningsmotor (dokument), gjorde igenkänning av större, strategiskt viktiga objekt i en videoström.

Problem uttalande

Med hjälp av befintlig utveckling, bygg ett tankigenkänningssystem som gör det möjligt att klassificera ett objekt, samt bestämma grundläggande geometriska indikatorer (orientering och avstånd) under dåligt kontrollerade förhållanden utan användning av specialiserad utrustning.

beslutet

Vi valde metoden för statistisk maskininlärning som huvudalgoritm för att lösa problemet. Men ett av de viktigaste problemen med maskininlärning är behovet av att ha en tillräcklig mängd träningsdata. Naturliga bilder erhållna från verkliga scener som innehåller de föremål vi behöver är uppenbarligen inte tillgängliga för oss. Därför beslutades det att ta till att generera nödvändiga data för träning, lyckligtvis Vi har mycket erfarenhet på det här stället. Och ändå verkade det onaturligt för oss att helt syntetisera data för denna uppgift, så en speciell layout förbereddes för att simulera verkliga scener. Modellen innehåller olika föremål som simulerar landskapet: karakteristisk landskapsbeklädnad, buskar, träd, staket, etc. Bilderna togs med en digitalkamera i litet format. Under bildtagningsprocessen förändrades scenens bakgrund avsevärt för att göra algoritmerna mer robusta mot bakgrundsförändringar.

Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

Målobjekten var 4 modeller av stridsvagnar: T-90 (Ryssland), M1A2 Abrams (USA), T-14 (Ryssland), Merkava III (Israel). Objekt placerades på olika positioner av polygonen, vilket utökade listan över acceptabla synliga vinklar för objektet. Tekniska barriärer, träd, buskar och andra landskapselement spelade en betydande roll.

Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

På ett par dagar samlade vi alltså ett tillräckligt set för träning och efterföljande utvärdering av kvaliteten på algoritmen (flera tiotusentals bilder).

De bestämde sig för att dela upp själva igenkänningen i två delar: objektlokalisering och objektklassificering. Lokalisering utfördes med hjälp av en tränad Viola och Jones klassificerare (trots allt är en tank ett normalt stelt föremål, inte värre än ett ansikte, så den "detaljblinda" metoden av Viola och Jones lokaliserar snabbt målobjektet). Men vi anförtrodde klassificeringen och bestämningen av vinkeln till ett konvolutionellt neuralt nätverk - i denna uppgift är det viktigt för oss att detektorn framgångsrikt identifierar de egenskaper som, säg, skiljer T-90 från Merkava. Som ett resultat var det möjligt att konstruera en effektiv sammansättning av algoritmer som framgångsrikt löser problemet med lokalisering och klassificering av objekt av samma typ.

Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

Därefter lanserade vi det resulterande programmet på alla våra befintliga plattformar (Intel, ARM, Elbrus, Baikal, KOMDIV), optimerade beräkningssvåra algoritmer för att öka prestandan (vi har redan skrivit om detta flera gånger i våra artiklar, till exempel här https://habr.com/ru/company/smartengines/blog/438948/ eller https://habr.com/ru/company/smartengines/blog/351134/) och uppnådde stabil drift av programmet på enheten i realtid.


Som ett resultat av alla beskrivna åtgärder har vi erhållit en fullfjädrad mjukvaruprodukt med betydande taktiska och tekniska egenskaper.

Smart tankläsare

Så vi presenterar för dig vår nya utveckling - ett program för att känna igen bilder av tankar i en videoström Smart tankläsare, som:

Igenkänning av tankar i en videoström med hjälp av maskininlärningsmetoder (+2 videor på Elbrus- och Baikal-plattformarna)

  • Löser problemet med "vän eller fiende" för en given uppsättning objekt i realtid;
  • Bestämmer geometriska parametrar (avstånd till objektet, föredragen orientering av objektet);
  • Fungerar under okontrollerade väderförhållanden, såväl som vid partiell blockering av föremålet av främmande föremål;
  • Helt autonom drift på målenheten, inklusive i frånvaro av radiokommunikation;
  • Lista över processorarkitekturer som stöds: Elbrus, Baikal, KOMDIV, såväl som x86, x86_64, ARM;
  • Lista över operativsystem som stöds: Elbrus OS, AstraLinux OS, Atlix OS, samt MS Windows, macOS, olika Linux-distributioner som stöder gcc 4.8, Android, iOS;
  • Helt inhemsk utveckling.

Vanligtvis, i avslutningen av våra artiklar om Habré, tillhandahåller vi en länk till marknadsplatsen, där alla som använder sin mobiltelefon kan ladda ner en demoversion av applikationen för att faktiskt utvärdera teknikens prestanda. Den här gången, med hänsyn till detaljerna i den resulterande applikationen, önskar vi att alla våra läsare aldrig i sina liv ska möta problemet med att snabbt avgöra om en tank tillhör en viss sida.

Källa: will.com

Lägg en kommentar