OpenCV 4.7 (کتابخانه بینایی کامپیوتر متنباز)، یک کتابخانه رایگان برای پردازش و تحلیل تصویر، منتشر شده است. OpenCV بیش از ۲۵۰۰ الگوریتم، از جمله الگوریتمهای کلاسیک و الگوریتمهایی که منعکسکننده آخرین پیشرفتها در بینایی کامپیوتر و یادگیری ماشین هستند، ارائه میدهد. کد این کتابخانه به زبان ++C نوشته شده و تحت مجوز BSD توزیع شده است. اتصالها برای زبانهای برنامهنویسی مختلف، از جمله پایتون، متلب و جاوا، در دسترس هستند.
این کتابخانه میتواند برای تشخیص اشیاء در عکسها و ویدیوها (مثلاً تشخیص چهرهها و اشکال انسانی، متن و غیره)، ردیابی حرکت اشیاء و دوربین، طبقهبندی اقدامات در ویدیوها، تبدیل تصاویر، استخراج مدلهای سهبعدی، تشکیل فضای سهبعدی از تصاویر دوربینهای استریو، ایجاد تصاویر با کیفیت بالا با ترکیب تصاویر با کیفیت پایینتر، جستجوی اشیاء در یک تصویر مشابه مجموعهای از عناصر ارائه شده، اعمال روشهای یادگیری ماشین، قرار دادن نشانگرها، شناسایی عناصر مشترک در تصاویر مختلف و حذف خودکار نقصهایی مانند اثر قرمزی چشم استفاده شود.
از جمله تغییرات نسخه جدید:
- بهینهسازیهای قابل توجهی برای عملکرد کانولوشن در ماژول DNN (شبکه عصبی عمیق) پیادهسازی شده است که امکان پیادهسازی الگوریتمهای یادگیری ماشین مبتنی بر شبکه عصبی را فراهم میکند. الگوریتم کانولوشن سریع Vinograd پیادهسازی شده است. لایههای جدید ONNX (تبادل شبکه عصبی باز) اضافه شدهاند: Scatter، ScatterND، Tile، ReduceL1 و ReduceMin. پشتیبانی از چارچوب OpenVino 2022.1 و بکاند CANN اضافه شده است.
- کیفیت تشخیص و رمزگشایی کد QR بهبود یافته است.
- پشتیبانی از نشانگرهای بصری ArUco و AprilTag اضافه شد.
- ردیاب Nanotrack v2 مبتنی بر شبکههای عصبی اضافه شد.
- الگوریتم تاری Stackblur پیادهسازی شده است.
- پشتیبانی از FFmpeg 5.x و CUDA 12.0 اضافه شد.
- یک API جدید برای دستکاری فرمتهای تصویر چند صفحهای ارائه شده است.
- پشتیبانی از کتابخانه libSPNG برای فرمت PNG اضافه شد.
- libJPEG-Turbo از شتابدهی دستورالعملهای SIMD استفاده میکند.
- پشتیبانی از H264/H265 برای پلتفرم اندروید پیادهسازی شده است.
- تمام API های اساسی برای زبان پایتون ارائه شده است.
- یک backend عمومی جدید برای دستورالعملهای برداری اضافه شد.
منبع: opennet.ru
