Release van OpenCV 4.7 computer vision-bibliotheek

De gratis bibliotheek OpenCV 4.7 (Open Source Computer Vision Library) is uitgebracht. Deze bibliotheek biedt tools voor het verwerken en analyseren van beeldinhoud. OpenCV biedt meer dan 2500 algoritmen, zowel klassieke algoritmen als algoritmen die de nieuwste ontwikkelingen op het gebied van computer vision en machine learning weerspiegelen. De code van de bibliotheek is geschreven in C++ en wordt gedistribueerd onder de BSD-licentie. Bindings zijn beschikbaar voor diverse programmeertalen, waaronder Python, MATLAB en Java.

De bibliotheek kan worden gebruikt om objecten in foto's en video's te herkennen (bijvoorbeeld gezichten en figuren van mensen, tekst, etc. herkennen), de beweging van objecten en de camera te volgen, acties op video te classificeren, afbeeldingen te transformeren, 3D-modellen te extraheren, 3D-ruimte vormen uit afbeeldingen van stereocamera's, afbeeldingen van hoge kwaliteit creëren door afbeeldingen van lagere kwaliteit te combineren, zoeken naar objecten die lijken op de gepresenteerde reeks elementen in de afbeelding, machine learning-methoden toepassen, markeringen plaatsen, gemeenschappelijke elementen in verschillende afbeeldingen identificeren, automatische eliminatie van defecten zoals rode ogen.

Onder de veranderingen in de nieuwe release:

  • In de DNN-module (Deep Neural Network) werd een aanzienlijke optimalisatie van de convolutieprestaties uitgevoerd door de implementatie van algoritmen voor machinaal leren op basis van neurale netwerken. Het snelle convolutiealgoritme van Winograd is geïmplementeerd. Nieuwe ONNX-lagen (Open Neural Network Exchange) toegevoegd: Scatter, ScatterND, Tile, ReduceL1 en ReduceMin. Ondersteuning toegevoegd voor het OpenVino 2022.1-framework en CANN-backend.
  • Verbeterde kwaliteit van QR-codedetectie en -decodering.
  • Ondersteuning toegevoegd voor visuele markeringen van ArUco en AprilTag.
  • Nanotrack v2-tracker toegevoegd op basis van neurale netwerken.
  • Het Stackblur-vervagingsalgoritme is geïmplementeerd.
  • Ondersteuning toegevoegd voor FFmpeg 5.x en CUDA 12.0.
  • Er wordt een nieuwe API voorgesteld voor het manipuleren van afbeeldingsformaten die uit meerdere pagina's bestaan.
  • Ondersteuning toegevoegd voor de libSPNG-bibliotheek voor het PNG-formaat.
  • libJPEG-Turbo maakt gebruik van SIMD-instructieversnelling.
  • H264/H265-ondersteuning is geïmplementeerd voor het Android-platform.
  • Alle basis-API's voor de Python-taal zijn beschikbaar.
  • Nieuwe, algemene backend toegevoegd voor vectorinstructies.

Bron: opennet.ru

Voeg een reactie