Wydanie biblioteki wizji komputerowej OpenCV 4.2

Odbyła się bezpłatne wydanie biblioteki OpenCV 4.2 (Open Source Computer Vision Library), która udostępnia narzędzia do przetwarzania i analizowania treści obrazu. OpenCV zapewnia ponad 2500 algorytmów, zarówno klasycznych, jak i odzwierciedlających najnowsze osiągnięcia w systemach wizji komputerowej i uczenia maszynowego. Kod biblioteki jest napisany w C++ i dystrybuowane przez na licencji BSD. Wiązania przygotowane są dla różnych języków programowania, w tym Python, MATLAB i Java.

Bibliotekę można wykorzystać do rozpoznawania obiektów na zdjęciach i filmach (np. rozpoznawania twarzy i postaci ludzi, tekstu itp.), śledzenia ruchu obiektów i kamery, klasyfikowania działań na wideo, przekształcania obrazów, wyodrębniania modeli 3D, tworzyć przestrzeń 3D z obrazów z kamer stereoskopowych, tworzyć wysokiej jakości obrazy poprzez łączenie obrazów o niższej jakości, szukać obiektów podobnych do prezentowanego zestawu elementów na obrazie, stosować metody uczenia maszynowego, umieszczać znaczniki, identyfikować wspólne elementy w różnych obrazach, automatycznie eliminując defekty takie jak efekt czerwonych oczu.

В Nowy uwolnienie:

  • Do modułu DNN (Deep Neural Network) dodano backend do obsługi CUDA wraz z implementacją algorytmów uczenia maszynowego bazującego na sieciach neuronowych oraz zaimplementowano eksperymentalne wsparcie API nGraph OpenVINO;
  • Używając instrukcji SIMD, wydajność kodu została zoptymalizowana pod kątem wyjścia stereo (StereoBM/StereoSGBM), zmiany rozmiaru, maskowania, obracania, obliczania brakujących składników koloru i wielu innych operacji;
  • Dodano wielowątkową implementację funkcji pyrDół;
  • Dodano możliwość wyodrębniania strumieni wideo z kontenerów multimediów (demuxing) przy użyciu backendu videoio opartego na FFmpeg;
  • Dodano algorytm szybkiej rekonstrukcji uszkodzonych obrazów z częstotliwością selektywną FSR (Rekonstrukcja selektywna częstotliwościowo);
  • Dodano metodę RIC do interpolacji typowych niewypełnionych obszarów;
  • Dodano metodę normalizacji odchyleń LOGOS;
  • Moduł G-API (opencv_gapi), który pełni rolę silnika wydajnego przetwarzania obrazu przy użyciu algorytmów opartych na grafach, obsługuje bardziej złożone hybrydowe algorytmy widzenia komputerowego i głębokie algorytmy uczenia maszynowego. Zapewniona jest obsługa zaplecza Intel Inference Engine. Dodano obsługę przetwarzania strumieni wideo do modelu wykonawczego;
  • Wyłączony luki w zabezpieczeniach (CVE-2019-5063, CVE-2019-5064), co może potencjalnie doprowadzić do wykonania kodu przez osobę atakującą podczas przetwarzania niezweryfikowanych danych w formatach XML, YAML i JSON. Jeśli podczas analizowania JSON napotkany zostanie znak z kodem null, cała wartość zostanie skopiowana do bufora, ale bez odpowiedniego sprawdzenia, czy przekracza ona granice przydzielonego obszaru pamięci.

Źródło: opennet.ru

Dodaj komentarz