Компьютерийн харааны номын сангийн OpenCV 4.2 хувилбар

болсон номын сангийн үнэгүй хувилбар OpenCV 4.2 (Нээлттэй эхийн компьютерийн харааны номын сан) нь зургийн агуулгыг боловсруулах, шинжлэх хэрэгслүүдээр хангадаг. OpenCV нь сонгодог бөгөөд компьютерийн хараа, машин сургалтын системийн сүүлийн үеийн дэвшлийг тусгасан 2500 гаруй алгоритмаар хангадаг. Номын сангийн код нь C++ хэл дээр бичигдсэн ба тараасан BSD лицензийн дагуу. Python, MATLAB, Java зэрэг янз бүрийн програмчлалын хэлнүүдэд зориулсан холболтуудыг бэлтгэдэг.

Номын сан нь гэрэл зураг, видеон дээрх объектуудыг таних (жишээлбэл, хүмүүсийн нүүр царай, дүрсийг таних, текст гэх мэт), объект, камерын хөдөлгөөнийг хянах, видеон дээрх үйлдлийг ангилах, зураг хөрвүүлэх, 3D загвар гаргах, стерео камерын зургуудаас 3D орон зай үүсгэх, чанар муутай зургуудыг нэгтгэх замаар өндөр чанартай зураг үүсгэх, зураг дээрх элементүүдийн багцтай ижил төстэй объектуудыг хайх, машин сургалтын аргуудыг ашиглах, маркеруудыг байрлуулах, өөр өөр зүйлд нийтлэг элементүүдийг тодорхойлох улаан нүд зэрэг согогийг автоматаар арилгадаг зураг.

В шинэ суллах:

  • DNN (Гүн мэдрэлийн сүлжээ) модульд CUDA-г ашиглах backend-г нэмж, мэдрэлийн сүлжээнд суурилсан машин сургалтын алгоритмуудыг хэрэгжүүлж, туршилтын API дэмжлэгийг хэрэгжүүлэв. nGraph OpenVINO;
  • SIMD зааврыг ашиглан кодын гүйцэтгэлийг стерео гаралт (StereoBM/StereoSGBM), хэмжээг өөрчлөх, далдлах, эргүүлэх, дутуу өнгөт бүрэлдэхүүн хэсгүүдийг тооцоолох болон бусад олон үйлдлүүдэд оновчтой болгосон;
  • Функцийн олон урсгалтай хэрэгжилтийг нэмсэн pyrDown;
  • FFmpeg дээр суурилсан videoio арын хэсгийг ашиглан медиа савнаас видео урсгалыг задлах (demuxing) боломжийг нэмсэн;
  • Гэмтсэн зургуудыг давтамжийн сонголтоор хурдан сэргээх алгоритмыг нэмсэн FSR (Давтамжийн сонгомол сэргээн босголт);
  • Нэмсэн арга МХХТ-ийн тев ердийн дүүргэгдээгүй талбайн интерполяцийн хувьд;
  • Хазайлтыг хэвийн болгох аргыг нэмсэн Logos;
  • G-API модуль (opencv_gapi) нь графикт суурилсан алгоритмуудыг ашиглан дүрсийг үр дүнтэй боловсруулах хөдөлгүүр болж, илүү нарийн төвөгтэй эрлийз компьютерийн хараа болон гүн гүнзгий машин сургалтын алгоритмуудыг дэмждэг. Intel Inference Engine-ийн арын хэсэгт дэмжлэг үзүүлж байна. Гүйцэтгэлийн загварт видео урсгалыг боловсруулах дэмжлэг нэмэгдсэн;
  • Арилгасан эмзэг байдал (CVE-2019-5063, CVE-2019-5064), XML, YAML болон JSON форматаар баталгаажуулаагүй өгөгдлийг боловсруулах үед халдагчийн кодыг гүйцэтгэхэд хүргэж болзошгүй. Хэрэв JSON задлан шинжлэх явцад тэг кодтой тэмдэгт тааралдвал утгыг бүхэлд нь буферт хуулах боловч энэ нь хуваарилагдсан санах ойн хязгаараас хэтэрсэн эсэхийг сайтар шалгахгүйгээр.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх