Sortie de la bibliothèque de vision par ordinateur OpenCV 4.7

La bibliothèque gratuite OpenCV 4.7 (Open Source Computer Vision Library) a été publiée, fournissant des outils de traitement et d'analyse du contenu des images. OpenCV fournit plus de 2500 XNUMX algorithmes, à la fois classiques et reflétant les dernières avancées en matière de systèmes de vision par ordinateur et d'apprentissage automatique. Le code de la bibliothèque est écrit en C++ et distribué sous licence BSD. Les liaisons sont préparées pour divers langages de programmation, notamment Python, MATLAB et Java.

La bibliothèque peut être utilisée pour reconnaître des objets dans des photographies et des vidéos (par exemple, reconnaissance de visages et de figures de personnes, de texte, etc.), suivre le mouvement d'objets et de caméras, classer des actions dans une vidéo, convertir des images, extraire des modèles 3D, générer un espace 3D à partir d'images de caméras stéréo, créer des images de haute qualité en combinant des images de qualité inférieure, rechercher des objets dans l'image similaires à l'ensemble d'éléments présenté, appliquer des méthodes d'apprentissage automatique, placer des marqueurs, identifier des éléments communs dans différents images, éliminant automatiquement les défauts tels que les yeux rouges.

Parmi les changements de la nouvelle version :

  • Une optimisation significative des performances de convolution dans le module DNN (Deep Neural Network) a été réalisée avec la mise en œuvre d'algorithmes d'apprentissage automatique basés sur des réseaux de neurones. L'algorithme de convolution rapide Winograd a été implémenté. Ajout de nouvelles couches ONNX (Open Neural Network Exchange) : Scatter, ScatterND, Tile, ReductionL1 et ReductionMin. Ajout de la prise en charge du framework OpenVino 2022.1 et du backend CANN.
  • Qualité améliorée de la détection et du décodage du code QR.
  • Ajout de la prise en charge des marqueurs visuels ArUco et AprilTag.
  • Ajout du tracker Nanotrack v2 basé sur les réseaux de neurones.
  • Implémentation de l'algorithme de flou Stackblur.
  • Ajout de la prise en charge de FFmpeg 5.x et CUDA 12.0.
  • Une nouvelle API a été proposée pour manipuler les formats d'image multipages.
  • Ajout du support de la bibliothèque libSPNG pour le format PNG.
  • libJPEG-Turbo permet l'accélération à l'aide des instructions SIMD.
  • Pour la plateforme Android, la prise en charge de H264/H265 a été implémentée.
  • Toutes les API Python de base sont fournies.
  • Ajout d'un nouveau backend universel pour les instructions vectorielles.

Source: opennet.ru

Ajouter un commentaire