Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

Im Rahmen unserer Tätigkeit stehen wir täglich vor dem Problem, Entwicklungsprioritäten festzulegen. Angesichts der hohen Entwicklungsdynamik der IT-Branche und der ständig steigenden Nachfrage von Wirtschaft und Regierung nach neuen Technologien stellen wir dies jedes Mal sicher, wenn wir den Entwicklungsvektor bestimmen und unsere eigenen Kräfte und Mittel in das wissenschaftliche Potenzial unseres Unternehmens investieren Alle unsere Forschungen und Projekte sind grundlegender und interdisziplinärer Natur.

Daher geht es uns bei der Entwicklung unserer Haupttechnologie – dem HIEROGLYPH-Datenerkennungs-Framework – sowohl um die Verbesserung der Qualität der Dokumentenerkennung (unser Hauptgeschäftsbereich) als auch um die Möglichkeit, die Technologie zur Lösung damit verbundener Erkennungsprobleme zu nutzen. Im heutigen Artikel erzählen wir Ihnen, wie wir auf Basis unserer Erkennungsmaschine (Dokumente) größere, strategisch wichtige Objekte in einem Videostream erkannt haben.

Formulierung des Problems

Bauen Sie unter Nutzung vorhandener Entwicklungen ein Panzererkennungssystem auf, das die Klassifizierung eines Objekts sowie die Bestimmung grundlegender geometrischer Indikatoren (Ausrichtung und Entfernung) unter schlecht kontrollierten Bedingungen ohne den Einsatz spezieller Ausrüstung ermöglicht.

Lösung

Als Hauptalgorithmus zur Lösung des Problems haben wir den Ansatz des statistischen maschinellen Lernens gewählt. Eines der Hauptprobleme des maschinellen Lernens ist jedoch die Notwendigkeit einer ausreichenden Menge an Trainingsdaten. Offensichtlich stehen uns natürliche Bilder aus realen Szenen mit den von uns benötigten Objekten nicht zur Verfügung. Daher wurde glücklicherweise beschlossen, auf die Generierung der für das Training notwendigen Daten zurückzugreifen Wir haben hier viel Erfahrung. Und doch schien es uns unnatürlich, die Daten für diese Aufgabe vollständig zu synthetisieren, also wurde ein spezielles Layout erstellt, um reale Szenen zu simulieren. Das Modell enthält verschiedene Objekte, die die Landschaft simulieren: charakteristische Landschaftsbedeckung, Büsche, Bäume, Zäune usw. Die Bilder wurden mit einer Kleinformat-Digitalkamera aufgenommen. Während des Bilderfassungsprozesses änderte sich der Hintergrund der Szene erheblich, um die Algorithmen robuster gegenüber Hintergrundänderungen zu machen.

Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

Die Zielobjekte waren 4 Modelle von Kampfpanzern: T-90 (Russland), M1A2 Abrams (USA), T-14 (Russland), Merkava III (Israel). Objekte befanden sich an verschiedenen Positionen des Polygons, wodurch die Liste der akzeptablen sichtbaren Winkel des Objekts erweitert wurde. Eine wesentliche Rolle spielten technische Barrieren, Bäume, Sträucher und andere Landschaftselemente.

Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

So haben wir in wenigen Tagen einen ausreichenden Satz für das Training und die anschließende Bewertung der Qualität des Algorithmus zusammengestellt (mehrere Zehntausend Bilder).

Sie beschlossen, die Erkennung selbst in zwei Teile aufzuteilen: Objektlokalisierung und Objektklassifizierung. Die Lokalisierung wurde mit einem trainierten Klassifikator von Viola und Jones durchgeführt (schließlich ist ein Panzer ein normales starres Objekt, nicht schlechter als ein Gesicht, sodass die „detailblinde“ Methode von Viola und Jones das Zielobjekt schnell lokalisiert). Aber wir haben die Klassifizierung und Bestimmung des Winkels einem Faltungs-Neuronalen Netzwerk anvertraut – bei dieser Aufgabe ist es für uns wichtig, dass der Detektor diejenigen Merkmale erfolgreich identifiziert, die beispielsweise den T-90 vom Merkava unterscheiden. Dadurch war es möglich, eine effektive Zusammenstellung von Algorithmen zu konstruieren, die das Problem der Lokalisierung und Klassifizierung gleichartiger Objekte erfolgreich löst.

Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

Als nächstes haben wir das resultierende Programm auf allen unseren bestehenden Plattformen (Intel, ARM, Elbrus, Baikal, KOMDIV) gestartet und rechenintensive Algorithmen optimiert, um die Leistung zu steigern (wir haben darüber bereits mehrfach in unseren Artikeln geschrieben, zum Beispiel hier). https://habr.com/ru/company/smartengines/blog/438948/ oder https://habr.com/ru/company/smartengines/blog/351134/) und einen stabilen Betrieb des Programms auf dem Gerät in Echtzeit erreicht.


Als Ergebnis aller beschriebenen Maßnahmen haben wir ein vollwertiges Softwareprodukt mit erheblichen taktischen und technischen Eigenschaften erhalten.

Intelligenter Tankleser

Deshalb präsentieren wir Ihnen unsere Neuentwicklung – ein Programm zur Erkennung von Panzerbildern in einem Videostream Intelligenter Tankleser, welche:

Erkennung von Panzern in einem Videostream mit Methoden des maschinellen Lernens (+2 Videos auf den Plattformen Elbrus und Baikal)

  • Löst das „Freund-Feind“-Problem für eine bestimmte Menge von Objekten in Echtzeit;
  • Bestimmt geometrische Parameter (Abstand zum Objekt, bevorzugte Ausrichtung des Objekts);
  • Funktioniert bei unkontrollierten Wetterbedingungen sowie bei teilweiser Blockierung des Objekts durch Fremdkörper;
  • Vollständig autonomer Betrieb auf dem Zielgerät, auch ohne Funkkommunikation;
  • Liste der unterstützten Prozessorarchitekturen: Elbrus, Baikal, KOMDIV sowie x86, x86_64, ARM;
  • Liste der unterstützten Betriebssysteme: Elbrus OS, AstraLinux OS, Atlix OS sowie MS Windows, macOS, verschiedene Linux-Distributionen, die gcc 4.8 unterstützen, Android, iOS;
  • Komplett inländische Entwicklung.

Normalerweise stellen wir am Ende unserer Artikel über Habré einen Link zum Marktplatz bereit, auf dem jeder, der sein Mobiltelefon nutzt, eine Demoversion der Anwendung herunterladen kann, um die Leistung der Technologie tatsächlich zu bewerten. Dieses Mal wünschen wir allen unseren Lesern unter Berücksichtigung der Besonderheiten des resultierenden Antrags, dass sie nie wieder vor dem Problem stehen, schnell festzustellen, ob ein Panzer zu einer bestimmten Seite gehört.

Source: habr.com

Kommentar hinzufügen