Wydanie biblioteki wizji komputerowej OpenCV 4.7

Nastąpiło udostępnienie darmowej biblioteki OpenCV 4.7 (Open Source Computer Vision Library), która udostępnia narzędzia do przetwarzania i analizy zawartości obrazu. OpenCV zapewnia ponad 2500 algorytmów, zarówno klasycznych, jak i odzwierciedlających najnowsze osiągnięcia w systemach wizji komputerowej i uczenia maszynowego. Kod biblioteki jest napisany w C++ i rozpowszechniany na licencji BSD. Wiązania przygotowane są dla różnych języków programowania, w tym Python, MATLAB i Java.

Bibliotekę można wykorzystać do rozpoznawania obiektów na zdjęciach i filmach (np. rozpoznawania twarzy i postaci ludzi, tekstu itp.), śledzenia ruchu obiektów i kamery, klasyfikowania działań na wideo, przekształcania obrazów, wyodrębniania modeli 3D, tworzyć przestrzeń 3D z obrazów z kamer stereoskopowych, tworzyć wysokiej jakości obrazy poprzez łączenie obrazów o niższej jakości, szukać obiektów podobnych do prezentowanego zestawu elementów na obrazie, stosować metody uczenia maszynowego, umieszczać znaczniki, identyfikować wspólne elementy w różnych obrazach, automatycznie eliminując defekty takie jak efekt czerwonych oczu.

Wśród zmian w nowej wersji:

  • Dokonano istotnej optymalizacji wydajności splotów w module DNN (Deep Neural Network) poprzez implementację algorytmów uczenia maszynowego bazujących na sieciach neuronowych. Zaimplementowano algorytm szybkiego splotu Winograda. Dodano nowe warstwy ONNX (Open Neural Network Exchange): Scatter, ScatterND, Tile, RedukujL1 i RedukujMin. Dodano obsługę frameworku OpenVino 2022.1 i backendu CANN.
  • Poprawiona jakość wykrywania i dekodowania kodów QR.
  • Dodano obsługę znaczników wizualnych ArUco i AprilTag.
  • Dodano tracker Nanotrack v2 oparty na sieciach neuronowych.
  • Zaimplementowano algorytm rozmycia Stackblur.
  • Dodano obsługę FFmpeg 5.x i CUDA 12.0.
  • Zaproponowano nowy interfejs API do manipulowania formatami obrazów wielostronicowych.
  • Dodano obsługę biblioteki libSPNG dla formatu PNG.
  • libJPEG-Turbo wykorzystuje przyspieszenia za pomocą instrukcji SIMD.
  • Dla platformy Android zaimplementowano obsługę H264/H265.
  • Dostępne są wszystkie podstawowe interfejsy API dla języka Python.
  • Dodano nowy uniwersalny backend dla instrukcji wektorowych.

Źródło: opennet.ru

Dodaj komentarz