Lançamento da biblioteca de visão computacional OpenCV 4.7

O OpenCV 4.7 (Open Source Computer Vision Library), uma biblioteca gratuita para processamento e análise de imagens, foi lançado. O OpenCV oferece mais de 2500 algoritmos, incluindo algoritmos clássicos e aqueles que refletem os avanços mais recentes em visão computacional e aprendizado de máquina. O código da biblioteca é escrito em C++ e distribuído sob a licença BSD. Existem interfaces disponíveis para diversas linguagens de programação, incluindo Python, MATLAB e Java.

A biblioteca pode ser usada para reconhecer objetos em fotografias e vídeos (por exemplo, reconhecimento de rostos e figuras de pessoas, texto, etc.), rastrear movimentos de objetos e câmeras, classificar ações em vídeo, converter imagens, extrair modelos 3D, gerar espaço 3D a partir de imagens de câmeras estéreo, criar imagens de alta qualidade combinando imagens de qualidade inferior, buscar objetos na imagem que sejam semelhantes ao conjunto de elementos apresentado, aplicar métodos de aprendizado de máquina, colocar marcadores, identificar elementos comuns em diferentes imagens, eliminando automaticamente defeitos como olhos vermelhos.

Entre as mudanças no novo lançamento:

  • Otimizações significativas no desempenho da convolução foram implementadas no módulo DNN (Deep Neural Network), possibilitando a implementação de algoritmos de aprendizado de máquina baseados em redes neurais. O algoritmo de convolução Vinograd, de alta velocidade, foi implementado. Novas camadas ONNX (Open Neural Network Exchange) foram adicionadas: Scatter, ScatterND, Tile, ReduceL1 e ReduceMin. O suporte para o framework OpenVino 2022.1 e o backend CANN também foi adicionado.
  • Melhoria na qualidade da detecção e decodificação de códigos QR.
  • Adicionado suporte para marcadores visuais ArUco e AprilTag.
  • Adicionado o rastreador Nanotrack v2 baseado em redes neurais.
  • O algoritmo de desfoque Stackblur foi implementado.
  • Adicionado suporte para FFmpeg 5.x e CUDA 12.0.
  • Propõe-se uma nova API para manipular formatos de imagem com várias páginas.
  • Adicionado suporte à biblioteca libSPNG para o formato PNG.
  • libJPEG-Turbo utiliza aceleração de instruções SIMD.
  • O suporte para H264/H265 foi implementado para a plataforma Android.
  • Todas as APIs básicas da linguagem Python são fornecidas.
  • Adicionada uma nova interface de uso geral para instruções vetoriais.

Fonte: opennet.ru

Adicionar um comentário