機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

私たちは活動の中で、開発の優先順位を決めるという課題に日々直面しています。 IT 業界の発展の高度なダイナミクス、新技術に対する企業や政府からの需要が絶えず増大していることを考慮し、開発のベクトルを決定し、当社の科学的可能性に自社の力と資金を投資するたびに、私たちは以下のことを確実に行っています。私たちのすべての研究とプロジェクトは基礎的かつ学際的な性質を持っています。

したがって、当社の主力技術である HIEROGLYPH データ認識フレームワークを開発することで、当社の主力事業である文書認識の品質向上と、関連する認識問題の解決にその技術を使用できる可能性の両方に関心を持っています。 今日の記事では、認識エンジン (ドキュメント) に基づいて、ビデオ ストリーム内のより大きく戦略的に重要なオブジェクトをどのように認識したかについて説明します。

問題の定式化

既存の開発を使用して、特殊な機器を使用せずに、制御が不十分な条件下で物体の分類と基本的な幾何学的指標 (方向と距離) の決定を可能にする戦車認識システムを構築します。

ソリューション

この問題を解決するための主なアルゴリズムとして、統計的機械学習アプローチを選択しました。 しかし、機械学習の重要な問題の XNUMX つは、十分な量のトレーニング データが必要なことです。 明らかに、必要なオブジェクトを含む実際のシーンから得られた自然な画像は利用できません。 したがって、幸いなことに、トレーニングに必要なデータを生成することに頼ることにしました。 私たちはこの場所で多くの経験を持っています。 とはいえ、この作業でデータを完全に合成するのは不自然だと思われたため、実際のシーンをシミュレートするために特別なレイアウトが用意されました。 モデルには、田舎をシミュレートするさまざまなオブジェクト (特徴的な景観カバー、茂み、木、フェンスなど) が含まれています。 画像は小型デジタルカメラを使用して撮影されました。 画像キャプチャ プロセス中に、背景の変化に対するアルゴリズムの堅牢性を高めるために、シーンの背景が大幅に変化しました。

機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

対象となったのは、T-4 (ロシア)、M90A1 エイブラムス (アメリカ)、T-2 (ロシア)、メルカバ III (イスラエル) の 14 車種の戦車です。 オブジェクトはポリゴンのさまざまな位置に配置され、それによってオブジェクトの許容可能な可視角度のリストが拡張されました。 工学的な障壁、樹木、茂み、その他の景観要素が重要な役割を果たしました。

機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

したがって、数日で、トレーニングとその後のアルゴリズムの品質評価に十分なセット (数万枚の画像) を収集しました。

彼らは、認識自体をオブジェクトの位置特定とオブジェクトの分類の 90 つの部分に分割することにしました。 位置特定は、トレーニング済みの Viola and Jones 分類器を使用して実行されました (結局のところ、戦車は通常の剛体であり、顔と変わらないため、Viola and Jones の「詳細ブラインド」メソッドはターゲット オブジェクトの位置を迅速に特定します)。 しかし、私たちは角度の分類と決定を畳み込みニューラル ネットワークに任せました。このタスクでは、検出器が、たとえば T-XNUMX とメルカバを区別する特徴をうまく識別できることが重要です。 その結果、同じ種類のオブジェクトの位置特定と分類の問題をうまく解決する効果的なアルゴリズムの構成を構築することができました。

機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

次に、結果として得られたプログラムを既存のすべてのプラットフォーム (Intel、ARM、Elbrus、Baikal、KOMDIV) 上で起動し、計算が難しいアルゴリズムを最適化してパフォーマンスを向上させました (これについては、すでに記事で何度か書いています。たとえば、ここにあります)。 https://habr.com/ru/company/smartengines/blog/438948/ または https://habr.com/ru/company/smartengines/blog/351134/)を実現し、デバイス上のプログラムのリアルタイムでの安定動作を実現しました。


記載されているすべてのアクションの結果、重要な戦術的および技術的特徴を備えた本格的なソフトウェア製品が得られました。

スマートタンクリーダー

そこで、私たちの新しい開発、ビデオストリーム内の戦車の画像を認識するプログラムを紹介します。 スマートタンクリーダー、 どれの:

機械学習手法を使用したビデオ ストリーム内の戦車の認識 (Elbrus および Baikal プラットフォーム上の + 2 ビデオ)

  • 特定のオブジェクトのセットに対する「敵か味方か」の問題をリアルタイムで解決します。
  • 幾何学的パラメータ (オブジェクトまでの距離、オブジェクトの優先方向) を決定します。
  • 制御不能な気象条件や、異物によって物体が部分的にブロックされた場合にも機能します。
  • 無線通信がない場合も含め、ターゲットデバイス上で完全に自律的に動作します。
  • サポートされているプロセッサ アーキテクチャのリスト: Elbrus、Baikal、KOMDIV、および x86、x86_64、ARM。
  • サポートされているオペレーティング システムのリスト: Elbrus OS、AstraLinux OS、Atlix OS、MS Windows、macOS、gcc 4.8 をサポートするさまざまな Linux ディストリビューション、Android、iOS。
  • 完全国内開発。

通常、ハブレに関する記事の最後にはマーケットプレイスへのリンクが記載されており、携帯電話を使用している人は誰でも、テクノロジーのパフォーマンスを実際に評価するためにアプリケーションのデモ版をダウンロードできます。 今回は、結果として得られるアプリケーションの詳細を考慮して、読者の皆様が、戦車が特定の側に属しているかどうかをすぐに判断するという問題に決して直面しないことを願っています。

出所: habr.com

コメントを追加します