Veröffentlichung der OpenCV 4.7 Computer Vision-Bibliothek

Die kostenlose Bibliothek OpenCV 4.7 (Open Source Computer Vision Library) ist erschienen. Sie bietet Werkzeuge zur Verarbeitung und Analyse von Bildinhalten. OpenCV bietet über 2500 Algorithmen, sowohl klassische als auch die neuesten Entwicklungen im Bereich Computer Vision und maschinelles Lernen. Der Bibliothekscode ist in C++ geschrieben und wird unter der BSD-Lizenz vertrieben. Anbindungen sind für verschiedene Programmiersprachen wie Python, MATLAB und Java vorbereitet.

Mithilfe der Bibliothek können Sie Objekte in Fotos und Videos erkennen (z. B. Gesichter und menschliche Figuren, Text usw. erkennen), die Bewegung von Objekten und Kameras verfolgen, Aktionen in Videos klassifizieren, Bilder transformieren, 3D-Modelle extrahieren, aus Bildern von Stereokameras einen 3D-Raum bilden, qualitativ hochwertige Bilder durch die Kombination von Bildern geringerer Qualität erstellen, in einem Bild nach Objekten suchen, die einem bestimmten Satz von Elementen ähneln, Methoden des maschinellen Lernens anwenden, Markierungen setzen, gemeinsame Elemente in verschiedenen Bildern identifizieren und Fehler wie den Rote-Augen-Effekt automatisch entfernen.

Zu den Änderungen in der neuen Version gehören:

  • Die Faltungsleistung im DNN-Modul (Deep Neural Network) wurde durch die Implementierung von Machine-Learning-Algorithmen auf Basis neuronaler Netzwerke deutlich optimiert. Der Winograd-Schnellfaltungsalgorithmus wurde implementiert. Neue ONNX-Ebenen (Open Neural Network Exchange) wurden hinzugefügt: Scatter, ScatterND, Tile, ReduceL1 und ReduceMin. Unterstützung für das OpenVino 2022.1-Framework und das CANN-Backend wurde hinzugefügt.
  • Verbesserte Qualität der QR-Code-Erkennung und -Dekodierung.
  • Unterstützung für visuelle Markierungen von ArUco und AprilTag hinzugefügt.
  • Nanotrack v2-Tracker basierend auf neuronalen Netzwerken hinzugefügt.
  • Der Stackblur-Unschärfealgorithmus wurde implementiert.
  • Unterstützung für FFmpeg 5.x und CUDA 12.0 hinzugefügt.
  • Es wird eine neue API zur Bearbeitung mehrseitiger Bildformate vorgeschlagen.
  • Unterstützung für die libSPNG-Bibliothek für das PNG-Format hinzugefügt.
  • libJPEG-Turbo verwendet die SIMD-Befehlsbeschleunigung.
  • Für die Android-Plattform wurde H264/H265-Unterstützung implementiert.
  • Alle grundlegenden APIs für die Sprache Python werden bereitgestellt.
  • Neues Allzweck-Backend für Vektoranweisungen hinzugefügt.

Source: opennet.ru

Kommentar hinzufügen