Έκδοση της βιβλιοθήκης όρασης υπολογιστή OpenCV 4.7

Πραγματοποιήθηκε η κυκλοφορία της δωρεάν βιβλιοθήκης OpenCV 4.7 (Open Source Computer Vision Library), η οποία παρέχει εργαλεία για την επεξεργασία και την ανάλυση περιεχομένου εικόνας. Το OpenCV παρέχει περισσότερους από 2500 αλγόριθμους, τόσο κλασικούς όσο και αντανακλώντας τις πιο πρόσφατες εξελίξεις στα συστήματα υπολογιστικής όρασης και μηχανικής μάθησης. Ο κώδικας της βιβλιοθήκης είναι γραμμένος σε C++ και διανέμεται με την άδεια BSD. Οι δεσμεύσεις προετοιμάζονται για διάφορες γλώσσες προγραμματισμού, συμπεριλαμβανομένων των Python, MATLAB και Java.

Η βιβλιοθήκη μπορεί να χρησιμοποιηθεί για την αναγνώριση αντικειμένων σε φωτογραφίες και βίντεο (για παράδειγμα, αναγνώριση προσώπων και φιγούρων ανθρώπων, κείμενο κ.λπ.), παρακολούθηση της κίνησης αντικειμένων και της κάμερας, ταξινόμηση ενεργειών σε βίντεο, μετατροπή εικόνων, εξαγωγή τρισδιάστατων μοντέλων, σχηματισμός τρισδιάστατου χώρου από εικόνες από στερεοφωνικές κάμερες, δημιουργία εικόνων υψηλής ποιότητας συνδυάζοντας εικόνες χαμηλότερης ποιότητας, αναζήτηση αντικειμένων παρόμοια με το παρουσιαζόμενο σύνολο στοιχείων στην εικόνα, εφαρμογή μεθόδων μηχανικής μάθησης, τοποθέτηση δεικτών, αναγνώριση κοινών στοιχείων σε διαφορετικές εικόνες, εξαλείφοντας αυτόματα ελαττώματα όπως τα κόκκινα μάτια.

Μεταξύ των αλλαγών στη νέα έκδοση:

  • Πραγματοποιήθηκε σημαντική βελτιστοποίηση της απόδοσης των συνελίξεων στη μονάδα DNN (Deep Neural Network) με την εφαρμογή αλγορίθμων μηχανικής μάθησης που βασίζονται σε νευρωνικά δίκτυα. Ο αλγόριθμος γρήγορης συνέλιξης του Winograd έχει εφαρμοστεί. Προστέθηκαν νέα επίπεδα ONNX (Open Neural Network Exchange): Scatter, ScatterND, Tile, ReduceL1 και ReduceMin. Προστέθηκε υποστήριξη για το πλαίσιο OpenVino 2022.1 και το backend CANN.
  • Βελτιωμένη ποιότητα ανίχνευσης και αποκωδικοποίησης κωδικών QR.
  • Προστέθηκε υποστήριξη για οπτικούς δείκτες ArUco και AprilTag.
  • Προστέθηκε ο ιχνηλάτης Nanotrack v2 βασισμένος σε νευρωνικά δίκτυα.
  • Εφάρμοσε τον αλγόριθμο θαμπώματος Stackblur.
  • Προστέθηκε υποστήριξη για FFmpeg 5.x και CUDA 12.0.
  • Έχει προταθεί ένα νέο API για τον χειρισμό μορφών εικόνων πολλών σελίδων.
  • Προστέθηκε υποστήριξη για τη βιβλιοθήκη libSPNG για μορφή PNG.
  • Το libJPEG-Turbo χρησιμοποιεί ταχύτητες χρησιμοποιώντας οδηγίες SIMD.
  • Η υποστήριξη για H264/H265 έχει υλοποιηθεί για την πλατφόρμα Android.
  • Παρέχονται όλα τα βασικά API για τη γλώσσα Python.
  • Προστέθηκε ένα νέο καθολικό backend για διανυσματικές οδηγίες.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο