OpenCV 4.7 コンピュータ ビジョン ライブラリのリリース

画像コンテンツを処理および分析するためのツールを提供する無料ライブラリ OpenCV 4.7 (オープン ソース コンピューター ビジョン ライブラリ) がリリースされました。 OpenCV は、古典的なアルゴリズムと、コンピュータ ビジョンおよび機械学習システムの最新の進歩を反映した 2500 を超えるアルゴリズムを提供します。 ライブラリ コードは C++ で記述され、BSD ライセンスに基づいて配布されます。 バインディングは、Python、MATLAB、Java などのさまざまなプログラミング言語用に用意されています。

このライブラリは、写真やビデオ内のオブジェクトの認識 (たとえば、人の顔や姿、テキストなどの認識)、オブジェクトとカメラの動きの追跡、ビデオ上のアクションの分類、画像の変換、3D モデルの抽出、ステレオカメラからの画像から 3D 空間を形成し、低品質の画像を組み合わせて高品質の画像を作成し、画像内で提示された一連の要素に類似したオブジェクトを検索し、機械学習手法を適用し、マーカーを配置し、異なる画像内の共通要素を識別します。赤目などの不具合を自動的に除去します。

新しいリリースの変更点には次のようなものがあります。

  • DNN (ディープ ニューラル ネットワーク) モジュールにおける畳み込みのパフォーマンスの大幅な最適化は、ニューラル ネットワークに基づく機械学習アルゴリズムの実装によって実行されました。 Winograd の高速畳み込みアルゴリズムが実装されています。 新しい ONNX (Open Neural Network Exchange) レイヤー: Scatter、ScatterND、Tile、ReduceL1、および ReduceMin を追加しました。 OpenVino 2022.1 フレームワークと CANN バックエンドのサポートが追加されました。
  • QR コードの検出とデコードの品質が向上しました。
  • ArUco および AprilTag ビジュアル マーカーのサポートが追加されました。
  • ニューラル ネットワークに基づいたトラッカー Nanotrack v2 を追加しました。
  • Stackblur ぼかしアルゴリズムを実装しました。
  • FFmpeg 5.x および CUDA 12.0 のサポートが追加されました。
  • マルチページ画像フォーマットを操作するための新しい API が提案されました。
  • PNG 形式の libSPNG ライブラリのサポートが追加されました。
  • libJPEG-Turbo は SIMD 命令を使用した高速化を使用します。
  • H264/H265 のサポートが Android プラットフォームに実装されました。
  • Python 言語の基本的な API がすべて提供されています。
  • ベクトル命令用の新しいユニバーサル バックエンドを追加しました。

出所: オープンネット.ru

コメントを追加します