Lanzamiento de la biblioteca de visión por computadora OpenCV 4.2

tuvo lugar lanzamiento gratuito de la biblioteca CV abierto 4.2 (Biblioteca de visión por computadora de código abierto), que proporciona herramientas para procesar y analizar el contenido de imágenes. OpenCV proporciona más de 2500 algoritmos, tanto clásicos como que reflejan los últimos avances en visión por computadora y sistemas de aprendizaje automático. El código de la biblioteca está escrito en C++ y distribuido por bajo licencia BSD. Los enlaces están preparados para varios lenguajes de programación, incluidos Python, MATLAB y Java.

La biblioteca se puede utilizar para reconocer objetos en fotografías y videos (por ejemplo, reconocimiento de rostros y figuras de personas, texto, etc.), rastrear el movimiento de objetos y cámaras, clasificar acciones en video, convertir imágenes, extraer modelos 3D, generar espacio 3D a partir de imágenes de cámaras estéreo, crear imágenes de alta calidad combinando imágenes de menor calidad, buscar objetos en la imagen que sean similares al conjunto de elementos presentado, aplicar métodos de aprendizaje automático, colocar marcadores, identificar elementos comunes en diferentes imágenes, eliminando automáticamente defectos como los ojos rojos.

В nuevo liberación:

  • Se agregó un backend para el uso de CUDA al módulo DNN (Deep Neural Network) con la implementación de algoritmos de aprendizaje automático basados ​​en redes neuronales y se implementó soporte API experimental. nGraph OpenVINO;
  • Utilizando instrucciones SIMD, se optimizó el rendimiento del código para salida estéreo (StereoBM/StereoSGBM), cambio de tamaño, enmascaramiento, rotación, cálculo de componentes de color faltantes y muchas otras operaciones;
  • Se agregó implementación multiproceso de la función. pyrabajo;
  • Se agregó la capacidad de extraer transmisiones de video de contenedores de medios (demuxing) usando el backend videoio basado en FFmpeg;
  • Se agregó un algoritmo para una rápida reconstrucción selectiva de frecuencia de imágenes dañadas. FSR (Reconstrucción Selectiva de Frecuencia);
  • Método agregado RIC para interpolación de áreas típicas sin rellenar;
  • Método de normalización de desviación agregado. LOGOTIPO;
  • El módulo G-API (opencv_gapi), que actúa como un motor para el procesamiento eficiente de imágenes utilizando algoritmos basados ​​en gráficos, admite visión por computadora híbrida más compleja y algoritmos de aprendizaje automático profundo. Se proporciona soporte para el backend de Intel Inference Engine. Se agregó soporte para procesar transmisiones de video al modelo de ejecución;
  • eliminado vulnerabilidades (CVE-2019-5063, CVE-2019-5064), lo que potencialmente puede provocar la ejecución de código por parte de un atacante al procesar datos no verificados en formatos XML, YAML y JSON. Si se encuentra un carácter con un código nulo durante el análisis JSON, el valor completo se copia al búfer, pero sin verificar adecuadamente si excede los límites del área de memoria asignada.

Fuente: opennet.ru

Añadir un comentario