Veröffentlichung der OpenCV 4.7 Computer Vision-Bibliothek

Die kostenlose Bibliothek OpenCV 4.7 (Open Source Computer Vision Library) wurde veröffentlicht und bietet Werkzeuge zur Verarbeitung und Analyse von Bildinhalten. OpenCV bietet mehr als 2500 Algorithmen, sowohl klassische als auch die neuesten Fortschritte in den Bereichen Computer Vision und maschinelles Lernen. Der Bibliothekscode ist in C++ geschrieben und wird unter der BSD-Lizenz vertrieben. Bindungen werden für verschiedene Programmiersprachen vorbereitet, darunter Python, MATLAB und Java.

Die Bibliothek kann verwendet werden, um Objekte in Fotos und Videos zu erkennen (z. B. Gesichter und Figuren von Personen, Text usw. zu erkennen), die Bewegung von Objekten und der Kamera zu verfolgen, Aktionen im Video zu klassifizieren, Bilder zu transformieren, 3D-Modelle zu extrahieren, Bilden eines 3D-Raums aus Bildern von Stereokameras, Erstellen hochwertiger Bilder durch Kombinieren von Bildern geringerer Qualität, Suchen nach Objekten im Bild, die dem präsentierten Satz von Elementen ähnlich sind, Anwenden maschineller Lernmethoden, Platzieren von Markierungen, Identifizieren gemeinsamer Elemente in verschiedenen Bilder und eliminiert automatisch Fehler wie rote Augen.

Zu den Änderungen in der neuen Version gehören:

  • Durch die Implementierung von Algorithmen für maschinelles Lernen auf Basis neuronaler Netze wurde eine erhebliche Optimierung der Faltungsleistung im DNN-Modul (Deep Neural Network) durchgeführt. Der schnelle Faltungsalgorithmus von Winograd wurde implementiert. Neue ONNX-Ebenen (Open Neural Network Exchange) hinzugefügt: Scatter, ScatterND, Tile, ReduceL1 und ReduceMin. Unterstützung für das OpenVino 2022.1-Framework und das CANN-Backend hinzugefügt.
  • Verbesserte Qualität der QR-Code-Erkennung und -Dekodierung.
  • Unterstützung für die visuellen Markierungen ArUco und AprilTag hinzugefügt.
  • Nanotrack v2-Tracker basierend auf neuronalen Netzen hinzugefügt.
  • Stackblur-Unschärfealgorithmus implementiert.
  • Unterstützung für FFmpeg 5.x und CUDA 12.0 hinzugefügt.
  • Für die Bearbeitung mehrseitiger Bildformate wurde eine neue API vorgeschlagen.
  • Unterstützung für die libSPNG-Bibliothek für das PNG-Format hinzugefügt.
  • libJPEG-Turbo ermöglicht die Beschleunigung mithilfe von SIMD-Anweisungen.
  • Für die Android-Plattform wurde Unterstützung für H264/H265 implementiert.
  • Alle grundlegenden Python-APIs werden bereitgestellt.
  • Ein neues universelles Backend für Vektoranweisungen hinzugefügt.

Source: opennet.ru

Kommentar hinzufügen