Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

Στην πορεία των δραστηριοτήτων μας αντιμετωπίζουμε καθημερινά το πρόβλημα του καθορισμού των αναπτυξιακών προτεραιοτήτων. Λαμβάνοντας υπόψη την υψηλή δυναμική ανάπτυξης του κλάδου της πληροφορικής, τη συνεχώς αυξανόμενη ζήτηση από επιχειρήσεις και κυβέρνηση για νέες τεχνολογίες, κάθε φορά που καθορίζουμε τον φορέα ανάπτυξης και επενδύουμε τις δικές μας δυνάμεις και κεφάλαια στο επιστημονικό δυναμικό της εταιρείας μας, φροντίζουμε ότι Όλες οι έρευνες και τα έργα μας είναι θεμελιώδους και διεπιστημονικού χαρακτήρα.

Επομένως, αναπτύσσοντας την κύρια τεχνολογία μας - το πλαίσιο αναγνώρισης δεδομένων HIEROGLYPH, μας ενδιαφέρει τόσο η βελτίωση της ποιότητας της αναγνώρισης εγγράφων (η κύρια επιχειρηματική μας γραμμή) όσο και η δυνατότητα χρήσης της τεχνολογίας για την επίλυση σχετικών προβλημάτων αναγνώρισης. Στο σημερινό άρθρο θα σας πούμε πώς, με βάση τη μηχανή αναγνώρισής μας (έγγραφα), κάναμε την αναγνώριση μεγαλύτερων, στρατηγικά σημαντικών αντικειμένων σε μια ροή βίντεο.

Δήλωση προβλήματος

Χρησιμοποιώντας τις υπάρχουσες εξελίξεις, κατασκευάστε ένα σύστημα αναγνώρισης δεξαμενής που καθιστά δυνατή την ταξινόμηση ενός αντικειμένου, καθώς και τον καθορισμό βασικών γεωμετρικών δεικτών (προσανατολισμός και απόσταση) σε κακώς ελεγχόμενες συνθήκες χωρίς τη χρήση εξειδικευμένου εξοπλισμού.

Λύση

Επιλέξαμε τη στατιστική προσέγγιση μηχανικής μάθησης ως τον κύριο αλγόριθμο για την επίλυση του προβλήματος. Αλλά ένα από τα βασικά προβλήματα της μηχανικής μάθησης είναι η ανάγκη να υπάρχει επαρκής όγκος δεδομένων εκπαίδευσης. Προφανώς, οι φυσικές εικόνες που λαμβάνονται από πραγματικές σκηνές που περιέχουν τα αντικείμενα που χρειαζόμαστε δεν είναι διαθέσιμες σε εμάς. Ως εκ τούτου, αποφασίστηκε να καταφύγουμε στη δημιουργία των απαραίτητων δεδομένων για την εκπαίδευση, ευτυχώς Έχουμε μεγάλη εμπειρία σε αυτό το μέρος. Κι όμως, μας φαινόταν αφύσικο να συνθέσουμε πλήρως τα δεδομένα για αυτήν την εργασία, έτσι ετοιμάστηκε μια ειδική διάταξη για την προσομοίωση πραγματικών σκηνών. Το μοντέλο περιέχει διάφορα αντικείμενα που προσομοιώνουν την ύπαιθρο: χαρακτηριστική κάλυψη τοπίου, θάμνους, δέντρα, φράχτες κ.λπ. Οι εικόνες καταγράφηκαν χρησιμοποιώντας μια ψηφιακή κάμερα μικρού φορμά. Κατά τη διαδικασία λήψης εικόνων, το φόντο της σκηνής άλλαξε σημαντικά για να γίνουν οι αλγόριθμοι πιο ανθεκτικοί στις αλλαγές φόντου.

Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

Τα αντικείμενα-στόχοι ήταν 4 μοντέλα αρμάτων μάχης: T-90 (Ρωσία), M1A2 Abrams (ΗΠΑ), T-14 (Ρωσία), Merkava III (Ισραήλ). Τα αντικείμενα εντοπίστηκαν σε διαφορετικές θέσεις του πολυγώνου, επεκτείνοντας έτσι τη λίστα των αποδεκτών ορατών γωνιών του αντικειμένου. Σημαντικό ρόλο έπαιξαν μηχανικοί φραγμοί, δέντρα, θάμνοι και άλλα στοιχεία του τοπίου.

Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

Έτσι, σε λίγες μέρες συγκεντρώσαμε ένα επαρκές σύνολο για εκπαίδευση και μετέπειτα αξιολόγηση της ποιότητας του αλγορίθμου (αρκετές δεκάδες χιλιάδες εικόνες).

Αποφάσισαν να χωρίσουν την ίδια την αναγνώριση σε δύο μέρη: εντοπισμός αντικειμένων και ταξινόμηση αντικειμένων. Ο εντοπισμός πραγματοποιήθηκε χρησιμοποιώντας έναν εκπαιδευμένο ταξινομητή Viola και Jones (εξάλλου, μια δεξαμενή είναι ένα κανονικό άκαμπτο αντικείμενο, όχι χειρότερο από ένα πρόσωπο, επομένως η μέθοδος "τυφλής λεπτομέρειας" των Viola και Jones εντοπίζει γρήγορα το αντικείμενο στόχο). Αλλά αναθέσαμε την ταξινόμηση και τον προσδιορισμό της γωνίας σε ένα συνελικτικό νευρωνικό δίκτυο - σε αυτό το έργο είναι σημαντικό για εμάς ο ανιχνευτής να εντοπίσει με επιτυχία εκείνα τα χαρακτηριστικά που, ας πούμε, διακρίνουν το T-90 από το Merkava. Ως αποτέλεσμα, κατέστη δυνατή η κατασκευή μιας αποτελεσματικής σύνθεσης αλγορίθμων που λύνει με επιτυχία το πρόβλημα του εντοπισμού και της ταξινόμησης αντικειμένων του ίδιου τύπου.

Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

Στη συνέχεια, ξεκινήσαμε το πρόγραμμα που προέκυψε σε όλες τις υπάρχουσες πλατφόρμες μας (Intel, ARM, Elbrus, Baikal, KOMDIV), βελτιστοποιήσαμε υπολογιστικά δύσκολους αλγόριθμους για αύξηση της απόδοσης (έχουμε ήδη γράψει για αυτό αρκετές φορές στα άρθρα μας, για παράδειγμα εδώ https://habr.com/ru/company/smartengines/blog/438948/ ή https://habr.com/ru/company/smartengines/blog/351134/) και πέτυχε σταθερή λειτουργία του προγράμματος στη συσκευή σε πραγματικό χρόνο.


Ως αποτέλεσμα όλων των περιγραφόμενων ενεργειών, αποκτήσαμε ένα πλήρες προϊόν λογισμικού με σημαντικά τακτικά και τεχνικά χαρακτηριστικά.

Έξυπνος αναγνώστης δεξαμενής

Σας παρουσιάζουμε, λοιπόν, τη νέα μας ανάπτυξη - ένα πρόγραμμα για την αναγνώριση εικόνων δεξαμενών σε ροή βίντεο Έξυπνος αναγνώστης δεξαμενής, οι οποίες:

Αναγνώριση δεξαμενών σε ροή βίντεο χρησιμοποιώντας μεθόδους μηχανικής εκμάθησης (+2 βίντεο στις πλατφόρμες Elbrus και Baikal)

  • Επιλύει το πρόβλημα «φίλου ή εχθρού» για ένα δεδομένο σύνολο αντικειμένων σε πραγματικό χρόνο.
  • Καθορίζει γεωμετρικές παραμέτρους (απόσταση από το αντικείμενο, προτιμώμενος προσανατολισμός του αντικειμένου).
  • Λειτουργεί σε μη ελεγχόμενες καιρικές συνθήκες, καθώς και σε περίπτωση μερικού μπλοκαρίσματος του αντικειμένου από ξένα αντικείμενα.
  • Πλήρως αυτόνομη λειτουργία στη συσκευή στόχο, συμπεριλαμβανομένης της απουσίας ραδιοεπικοινωνίας.
  • Λίστα υποστηριζόμενων αρχιτεκτονικών επεξεργαστών: Elbrus, Baikal, KOMDIV, καθώς και x86, x86_64, ARM.
  • Λίστα υποστηριζόμενων λειτουργικών συστημάτων: Elbrus OS, AstraLinux OS, Atlix OS, καθώς και MS Windows, macOS, διάφορες διανομές Linux που υποστηρίζουν gcc 4.8, Android, iOS.
  • Εντελώς εγχώρια ανάπτυξη.

Συνήθως, στο συμπέρασμα των άρθρων μας για το Habré, παρέχουμε έναν σύνδεσμο προς την αγορά, όπου οποιοσδήποτε χρησιμοποιεί το κινητό του τηλέφωνο μπορεί να κατεβάσει μια δοκιμαστική έκδοση της εφαρμογής για να αξιολογήσει πραγματικά την απόδοση της τεχνολογίας. Αυτή τη φορά, λαμβάνοντας υπόψη τις ιδιαιτερότητες της εφαρμογής που προκύπτει, ευχόμαστε σε όλους τους αναγνώστες μας να μην αντιμετωπίσουν ποτέ στη ζωή τους το πρόβλημα να προσδιορίσουν γρήγορα αν μια δεξαμενή ανήκει σε μια συγκεκριμένη πλευρά.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο