Wydanie biblioteki wizji komputerowej OpenCV 4.7

Udostępniono darmową bibliotekę OpenCV 4.7 (Open Source Computer Vision Library), która udostępnia narzędzia do przetwarzania i analizowania zawartości obrazu. OpenCV udostępnia ponad 2500 algorytmów, zarówno klasycznych, jak i odzwierciedlających najnowsze osiągnięcia w dziedzinie systemów przetwarzania obrazu i uczenia maszynowego. Kod biblioteki napisano w języku C++ i rozpowszechniano na podstawie licencji BSD. Dostępne są powiązania dla różnych języków programowania, w tym Python, MATLAB i Java.

Bibliotekę można wykorzystać do rozpoznawania obiektów na zdjęciach i filmach (np. rozpoznawania twarzy i postaci ludzi, tekstu itp.), śledzenia ruchu obiektów i kamery, klasyfikowania działań na wideo, przekształcania obrazów, wyodrębniania modeli 3D, tworzyć przestrzeń 3D z obrazów z kamer stereoskopowych, tworzyć wysokiej jakości obrazy poprzez łączenie obrazów o niższej jakości, szukać obiektów podobnych do prezentowanego zestawu elementów na obrazie, stosować metody uczenia maszynowego, umieszczać znaczniki, identyfikować wspólne elementy w różnych obrazach, automatycznie eliminując defekty takie jak efekt czerwonych oczu.

Wśród zmian w nowej wersji:

  • W module DNN (Deep Neural Network) przeprowadzono znaczącą optymalizację wydajności splotu dzięki implementacji algorytmów uczenia maszynowego bazujących na sieciach neuronowych. Zaimplementowano algorytm szybkiego splotu Winograda. Dodano nowe warstwy ONNX (Open Neural Network Exchange): Scatter, ScatterND, Tile, ReduceL1 i ReduceMin. Dodano obsługę środowiska OpenVino 2022.1 i zaplecza CANN.
  • Poprawiona jakość wykrywania i dekodowania kodów QR.
  • Dodano obsługę wizualnych znaczników ArUco i AprilTag.
  • Dodano moduł śledzący Nanotrack v2 bazujący na sieciach neuronowych.
  • Zaimplementowano algorytm rozmycia Stackblur.
  • Dodano obsługę FFmpeg 5.x i CUDA 12.0.
  • Zaproponowano nowe API do manipulowania wielostronicowymi formatami obrazów.
  • Dodano obsługę biblioteki libSPNG dla formatu PNG.
  • libJPEG-Turbo korzysta z akceleracji instrukcji SIMD.
  • Wprowadzono obsługę kodeków H264/H265 na platformie Android.
  • Dostępne są wszystkie podstawowe interfejsy API dla języka Python.
  • Dodano nowy uniwersalny moduł zaplecza dla instrukcji wektorowych.

Źródło: opennet.ru

Dodaj komentarz