Lanzamiento de la biblioteca de visión por computadora OpenCV 4.7

Se lanzó la biblioteca gratuita OpenCV 4.7 (Biblioteca de visión por computadora de código abierto), que proporciona herramientas para procesar y analizar el contenido de las imágenes. OpenCV proporciona más de 2500 algoritmos, tanto clásicos como que reflejan los últimos avances en visión por computadora y sistemas de aprendizaje automático. El código de la biblioteca está escrito en C++ y distribuido bajo la licencia BSD. Los enlaces están preparados para varios lenguajes de programación, incluidos Python, MATLAB y Java.

La biblioteca se puede utilizar para reconocer objetos en fotografías y videos (por ejemplo, reconocimiento de rostros y figuras de personas, texto, etc.), rastrear el movimiento de objetos y cámaras, clasificar acciones en video, convertir imágenes, extraer modelos 3D, generar espacio 3D a partir de imágenes de cámaras estéreo, crear imágenes de alta calidad combinando imágenes de menor calidad, buscar objetos en la imagen que sean similares al conjunto de elementos presentado, aplicar métodos de aprendizaje automático, colocar marcadores, identificar elementos comunes en diferentes imágenes, eliminando automáticamente defectos como los ojos rojos.

Entre los cambios en la nueva versión:

  • Se ha llevado a cabo una optimización significativa del rendimiento de convolución en el módulo DNN (Deep Neural Network) con la implementación de algoritmos de aprendizaje automático basados ​​en redes neuronales. Se ha implementado el algoritmo de convolución rápida de Winograd. Se agregaron nuevas capas ONNX (Open Neural Network Exchange): Scatter, ScatterND, Tile, ReduceL1 y ReduceMin. Se agregó soporte para el marco OpenVino 2022.1 y el backend CANN.
  • Calidad mejorada de detección y decodificación de códigos QR.
  • Se agregó soporte para marcadores visuales ArUco y AprilTag.
  • Se agregó el rastreador Nanotrack v2 basado en redes neuronales.
  • Implementado el algoritmo de desenfoque Stackblur.
  • Se agregó soporte para FFmpeg 5.x y CUDA 12.0.
  • Se ha propuesto una nueva API para manipular formatos de imágenes de varias páginas.
  • Se agregó soporte para la biblioteca libSPNG para el formato PNG.
  • libJPEG-Turbo permite la aceleración mediante instrucciones SIMD.
  • Para la plataforma Android, se ha implementado soporte para H264/H265.
  • Se proporcionan todas las API básicas de Python.
  • Se agregó un nuevo backend universal para instrucciones vectoriales.

Fuente: opennet.ru

Añadir un comentario