Выпуск библиотеки компьютерного зрения OpenCV 4.7

Состоялся релиз свободной библиотеки OpenCV 4.7 (Open Source Computer Vision Library), предоставляющей средства для обработки и анализа содержимого изображений. OpenCV предоставляет более 2500 алгоритмов, как классических, так и отражающих последние достижения в области компьютерного зрения и систем машинного обучения. Код библиотеки написан на языке С++ и распространяется под лицензией BSD. Биндинги подготовлены для различных языков программирования, включая Python, MATLAB и Java.

Библиотека может применяться для распознавания объектов на фотографиях и видео (например, распознавание лиц и фигур людей, текста и т.п.), отслеживания движения объектов и камеры, классификации действий на видео, преобразования изображений, извлечения 3D-моделей, формирования 3D-пространства из изображения от стереокамер, создания высококачественных изображений через объединение изображений более низкого качества, поиска на изображении объектов, похожих на представленный набор элементов, применения методов машинного обучения, расстановки маркеров, выявления общих элементов на разных изображениях, автоматического устранения дефектов, таких как эффект красных глаз.

Среди изменений в новом выпуске:

  • Проведена значительная оптимизация производительности свёрток в модуле DNN (Deep Neural Network) с реализацией алгоритмов машинного обучения на основе нейронных сетей. Реализован алгоритм быстрых свёрток Винограда. Добавлены новые слои ONNX (Open Neural Network Exchange): Scatter, ScatterND, Tile, ReduceL1 и ReduceMin. Добавлена поддержка фреймворка OpenVino 2022.1 и бэкенда CANN.
  • Улучшено качество определения и декодирования QR-кодов.
  • Добавлена поддержка визуальных маркеров ArUco и AprilTag.
  • Добавлен трекер Nanotrack v2 на базе нейронных сетей.
  • Реализован алгоритм размытия Stackblur.
  • Добавлена поддержка FFmpeg 5.x и CUDA 12.0.
  • Предложен новый API для манипуляций многостраничными форматами изображений.
  • Добавлена поддержка библиотеки libSPNG для формата PNG.
  • В libJPEG-Turbo задействовано ускорения при помощи SIMD-инструкций.
  • Для платформы Android реализована поддержка H264/H265.
  • Предоставлены все базовые API для языка Python.
  • Добавлен новый универсальный бэкенд для векторных инструкций.

Источник: opennet.ru

Добавить комментарий