OpenCV 4.7 ordenagailu bidezko ikusmenaren liburutegia kaleratzea

Irudien edukia prozesatzeko eta aztertzeko tresnak eskaintzen dituen OpenCV 4.7 (Open Source Computer Vision Library) doako liburutegiaren kaleratzea egin da. OpenCV-k 2500 algoritmo baino gehiago eskaintzen ditu, bai klasikoak bai ordenagailu bidezko ikusmenaren eta ikasketa automatikoko sistemetan egindako azken aurrerapenak islatzen dituztenak. Liburutegiaren kodea C++-n idatzita dago eta BSD lizentziapean banatzen da. Loturak hainbat programazio lengoaiatarako prestatzen dira, besteak beste, Python, MATLAB eta Java.

Liburutegia argazki eta bideoetako objektuak ezagutzeko (adibidez, pertsonen aurpegiak eta irudiak antzemateko, testua, etab.), objektuen eta kameraren mugimenduaren jarraipena egiteko, bideoko ekintzak sailkatzeko, irudiak eraldatzeko, 3D ereduak ateratzeko, erabil daiteke. 3D espazioa osatzea kamera estereoetatik ateratako irudietatik, kalitate handiko irudiak sortuz, kalitate baxuagoko irudiak konbinatuz, irudian aurkezten diren elementu multzoaren antzeko objektuak bilatuz, ikaskuntza automatikoko metodoak aplikatuz, markatzaileak jarriz, irudi ezberdinetan elementu komunak identifikatuz, begi gorriak bezalako akatsak automatikoki ezabatuz.

Argitalpen berriaren aldaketen artean:

  • DNN (Deep Neural Network) moduluko konboluzioen errendimenduaren optimizazio esanguratsua burutu da sare neuronaletan oinarritutako ikaskuntza automatikoko algoritmoak ezarrita. Winograd-en konboluzio azkarra algoritmoa inplementatu da. Gehitu dira ONNX (Open Neural Network Exchange) geruza berriak: Scatter, ScatterND, Tile, ReduceL1 eta ReduceMin. OpenVino 2022.1 esparrurako eta CANN backenderako euskarria gehitu da.
  • QR kodeak detektatzeko eta deskodetzeko kalitatea hobetu da.
  • ArUco eta AprilTag ikusizko markatzaileentzako euskarria gehitu da.
  • Nanotrack v2 jarraitzailea gehitu da sare neuronaletan oinarrituta.
  • Stackblur lausotze algoritmoa inplementatu du.
  • FFmpeg 5.x eta CUDA 12.0rako euskarria gehitu da.
  • Orrialde anitzeko irudi formatuak manipulatzeko API berri bat proposatu da.
  • PNG formatuan libSPNG liburutegirako euskarria gehitu da.
  • libJPEG-Turbo-k SIMD argibideak erabiliz bizkortzea erabiltzen du.
  • H264/H265 euskarria ezarri da Android plataformarako.
  • Python hizkuntzarako oinarrizko API guztiak eskaintzen dira.
  • Jarraibide bektorialetarako backend unibertsal berria gehitu da.

Iturria: opennet.ru

Gehitu iruzkin berria