Εντοπισμός ήχου: πώς ο εγκέφαλος αναγνωρίζει τις πηγές ήχου

Εντοπισμός ήχου: πώς ο εγκέφαλος αναγνωρίζει τις πηγές ήχου

Ο κόσμος γύρω μας είναι γεμάτος με κάθε είδους πληροφορίες που επεξεργάζεται συνεχώς ο εγκέφαλός μας. Λαμβάνει αυτές τις πληροφορίες μέσω των αισθητηρίων οργάνων, καθένα από τα οποία είναι υπεύθυνο για το μερίδιο των σημάτων του: μάτια (όραση), γλώσσα (γεύση), μύτη (όσφρηση), δέρμα (αφή), αιθουσαία συσκευή (ισορροπία, θέση στο χώρο και αίσθηση του βάρος) και αυτιά (ήχος). Συνδυάζοντας σήματα από όλα αυτά τα όργανα, ο εγκέφαλός μας μπορεί να δημιουργήσει μια ακριβή εικόνα του περιβάλλοντός μας. Αλλά δεν είναι γνωστές όλες οι πτυχές της επεξεργασίας εξωτερικών σημάτων. Ένα από αυτά τα μυστικά είναι ο μηχανισμός εντοπισμού της πηγής των ήχων.

Επιστήμονες από το Laboratory of Neuroengineering of Speech and Hearing (New Jersey Institute of Technology) πρότειναν ένα νέο μοντέλο της νευρωνικής διαδικασίας εντοπισμού του ήχου. Ποιες ακριβείς διεργασίες συμβαίνουν στον εγκέφαλο κατά την αντίληψη του ήχου, πώς ο εγκέφαλός μας κατανοεί τη θέση της πηγής ήχου και πώς αυτή η έρευνα μπορεί να βοηθήσει στην καταπολέμηση των ελαττωμάτων ακοής. Το μαθαίνουμε από την έκθεση της ερευνητικής ομάδας. Πηγαίνω.

Ερευνητική βάση

Οι πληροφορίες που λαμβάνει ο εγκέφαλός μας από τις αισθήσεις μας διαφέρουν μεταξύ τους, τόσο ως προς την πηγή τους όσο και ως προς την επεξεργασία τους. Ορισμένα σήματα εμφανίζονται αμέσως στον εγκέφαλό μας ως ακριβείς πληροφορίες, ενώ άλλα απαιτούν πρόσθετες υπολογιστικές διαδικασίες. Σε γενικές γραμμές, αισθανόμαστε αμέσως ένα άγγιγμα, αλλά όταν ακούμε έναν ήχο, πρέπει ακόμα να βρούμε από πού προέρχεται.

Η βάση για τον εντοπισμό των ήχων στο οριζόντιο επίπεδο είναι διαφωνητικό* διαφορά ώρας (ITD από διαφωνική διαφορά ώρας) ήχοι που φτάνουν στα αυτιά του ακροατή.

Διαφωνική βάση* - απόσταση μεταξύ των αυτιών.

Υπάρχει μια συγκεκριμένη περιοχή στον εγκέφαλο (η μεσαία ανώτερη ελιά ή MSO) που είναι υπεύθυνη για αυτή τη διαδικασία. Τη στιγμή της λήψης ενός ηχητικού σήματος στο MVO, οι διαφωνικές χρονικές διαφορές μετατρέπονται στον ρυθμό αντίδρασης των νευρώνων. Το σχήμα των καμπυλών ταχύτητας εξόδου MVO ως συνάρτηση του ITD μοιάζει με το σχήμα της συνάρτησης διασταυρούμενης συσχέτισης των σημάτων εισόδου για κάθε αυτί.

Το πώς επεξεργάζονται και ερμηνεύονται οι πληροφορίες στο MBO δεν παραμένει απολύτως σαφές, γι' αυτό και υπάρχουν πολλές πολύ αντιφατικές θεωρίες. Η πιο διάσημη και μάλιστα κλασική θεωρία εντοπισμού του ήχου είναι το μοντέλο Jeffress (Lloyd A. Jeffress). Βασίζεται σε σημειωμένη γραμμή* νευρώνες ανιχνευτή που είναι ευαίσθητοι στον διφωνικό συγχρονισμό των νευρικών εισόδων από κάθε αυτί, με κάθε νευρώνα να είναι εξαιρετικά ευαίσθητος σε μια ορισμένη ποσότητα ITD ().

Αρχή σημειωμένης γραμμής* είναι μια υπόθεση που εξηγεί πώς διαφορετικά νεύρα, τα οποία χρησιμοποιούν όλες τις ίδιες φυσιολογικές αρχές στη μετάδοση παλμών κατά μήκος των αξόνων τους, είναι σε θέση να παράγουν διαφορετικές αισθήσεις. Δομικά παρόμοια νεύρα μπορούν να δημιουργήσουν διαφορετικές αισθητηριακές αντιλήψεις εάν συνδέονται με μοναδικούς νευρώνες στο κεντρικό νευρικό σύστημα που είναι ικανοί να αποκωδικοποιούν παρόμοια νευρικά σήματα με διαφορετικούς τρόπους.

Εντοπισμός ήχου: πώς ο εγκέφαλος αναγνωρίζει τις πηγές ήχου
Εικόνα #1

Αυτό το μοντέλο είναι υπολογιστικά παρόμοιο με τη νευρωνική κωδικοποίηση, που βασίζεται σε απεριόριστες διασταυρούμενες συσχετίσεις ήχων που φτάνουν και στα δύο αυτιά.

Υπάρχει επίσης ένα μοντέλο που προτείνει ότι ο εντοπισμός του ήχου μπορεί να μοντελοποιηθεί με βάση τις διαφορές στην ταχύτητα απόκρισης ορισμένων πληθυσμών νευρώνων από διαφορετικά ημισφαίρια του εγκεφάλου, π.χ. μοντέλο μεσοημισφαιρικής ασυμμετρίας (1V).

Μέχρι τώρα, ήταν δύσκολο να δηλωθεί με σαφήνεια ποια από τις δύο θεωρίες (μοντέλα) είναι σωστή, δεδομένου ότι καθεμία από αυτές προβλέπει διαφορετικές εξαρτήσεις εντοπισμού του ήχου από την ένταση του ήχου.

Στη μελέτη που εξετάζουμε σήμερα, οι ερευνητές αποφάσισαν να συνδυάσουν και τα δύο μοντέλα για να καταλάβουν εάν η αντίληψη των ήχων βασίζεται σε νευρωνική κωδικοποίηση ή σε διαφορές στην απόκριση μεμονωμένων νευρικών πληθυσμών. Διεξήχθησαν αρκετά πειράματα στα οποία συμμετείχαν άτομα ηλικίας 18 έως 27 ετών (5 γυναίκες και 7 άνδρες). Η ακοομετρία των συμμετεχόντων (μέτρηση της ακουστικής οξύτητας) ήταν 25 dB ή υψηλότερη μεταξύ 250 και 8000 Hz. Ο συμμετέχων στα πειράματα τοποθετήθηκε σε ηχομονωμένο δωμάτιο, στο οποίο τοποθετήθηκε ειδικός εξοπλισμός, βαθμονομημένος με υψηλή ακρίβεια. Οι συμμετέχοντες έπρεπε, μόλις άκουσαν ένα ηχητικό σήμα, να υποδείξουν την κατεύθυνση από την οποία προερχόταν.

Αποτελέσματα της μελέτης

Για την αξιολόγηση της εξάρτησης πλευροποίηση* Η εγκεφαλική δραστηριότητα από την ένταση του ήχου σε απόκριση σε επισημασμένους νευρώνες, χρησιμοποιήθηκαν δεδομένα σχετικά με την ταχύτητα αντίδρασης των νευρώνων στον στρωτό πυρήνα του εγκεφάλου της κουκουβάγιας του αχυρώνα.

πλευρικότητα* - ασυμμετρία του αριστερού και του δεξιού μισού του σώματος.

Για να εκτιμηθεί η εξάρτηση της πλευριοποίησης της εγκεφαλικής δραστηριότητας από την ταχύτητα αντίδρασης ορισμένων πληθυσμών νευρώνων, χρησιμοποιήθηκαν δεδομένα από τη δραστηριότητα του κατώτερου κολλήματος του εγκεφάλου του πιθήκου rhesus, μετά την οποία υπολογίστηκαν επιπλέον οι διαφορές στην ταχύτητα των νευρώνων από διαφορετικά ημισφαίρια .

Το μοντέλο σημειωμένης γραμμής των νευρώνων ανιχνευτή προβλέπει ότι καθώς μειώνεται η ένταση του ήχου, η πλευρικότητα της αντιληπτής πηγής θα συγκλίνει σε μέσες τιμές παρόμοιες με την αναλογία απαλών προς δυνατών ήχων (1S).

Το μοντέλο ημισφαιρικής ασυμμετρίας, με τη σειρά του, υποδηλώνει ότι καθώς η ένταση του ήχου μειώνεται κοντά στα επίπεδα κατωφλίου, η αντιληπτή πλευρικότητα θα μετατοπιστεί προς τη μέση γραμμή (1D).

Σε υψηλότερη συνολική ένταση ήχου, η πλευροποίηση αναμένεται να είναι αμετάβλητη ένταση (ένθετα σε 1S и 1D).

Επομένως, η ανάλυση του τρόπου με τον οποίο η ένταση του ήχου επηρεάζει την αντιληπτή κατεύθυνση του ήχου μας επιτρέπει να προσδιορίσουμε με ακρίβεια τη φύση των διεργασιών που συμβαίνουν εκείνη τη στιγμή - νευρώνες από την ίδια γενική περιοχή ή νευρώνες από διαφορετικά ημισφαίρια.

Σαφώς, η ικανότητα ενός ατόμου να διακρίνει την ITD μπορεί να ποικίλλει ανάλογα με την ένταση του ήχου. Ωστόσο, οι επιστήμονες λένε ότι είναι δύσκολο να ερμηνευτούν προηγούμενα ευρήματα που συνδέουν την ευαισθησία με την ITD και την κρίση των ακροατών για την κατεύθυνση της πηγής ήχου ως συνάρτηση της έντασης του ήχου. Ορισμένες μελέτες λένε ότι όταν η ένταση του ήχου φτάσει σε ένα οριακό όριο, η αντιληπτή πλευρικότητα της πηγής μειώνεται. Άλλες μελέτες δείχνουν ότι δεν υπάρχει καμία επίδραση της έντασης στην αντίληψη.

Με άλλα λόγια, οι επιστήμονες υπαινίσσονται «ήπια» ότι υπάρχουν λίγες πληροφορίες στη βιβλιογραφία σχετικά με τη σχέση μεταξύ της ITD, της έντασης του ήχου και του προσδιορισμού της κατεύθυνσης της πηγής του. Υπάρχουν θεωρίες που υπάρχουν ως ένα είδος αξιωμάτων, γενικά αποδεκτά από την επιστημονική κοινότητα. Ως εκ τούτου, αποφασίστηκε να δοκιμαστούν αναλυτικά όλες οι θεωρίες, τα μοντέλα και οι πιθανοί μηχανισμοί της ακουστικής αντίληψης στην πράξη.

Το πρώτο πείραμα βασίστηκε σε ένα ψυχοφυσικό παράδειγμα που επέτρεψε τη μελέτη της πλευρικής πλάγιας με βάση την ITD ως συνάρτηση της έντασης του ήχου σε μια ομάδα δέκα συμμετεχόντων με φυσιολογική ακοή.

Εντοπισμός ήχου: πώς ο εγκέφαλος αναγνωρίζει τις πηγές ήχου
Εικόνα #2

Οι πηγές ήχου ρυθμίστηκαν ειδικά για να καλύπτουν το μεγαλύτερο μέρος του εύρους συχνοτήτων εντός του οποίου οι άνθρωποι είναι σε θέση να αναγνωρίσουν την ITD, δηλ. από 300 έως 1200 Hz ().

Σε κάθε δοκιμή, ο ακροατής έπρεπε να υποδεικνύει την αντιληπτή πλευρικότητα, μετρούμενη ως συνάρτηση του επιπέδου αίσθησης, σε ένα εύρος τιμών ITD από 375 έως 375 ms. Για τον προσδιορισμό της επίδρασης της έντασης του ήχου, χρησιμοποιήθηκε ένα μη γραμμικό μοντέλο μικτών εφέ (NMLE) που περιελάμβανε τόσο σταθερή όσο και τυχαία ένταση ήχου.

Πρόγραμμα 2V δείχνει την εκτιμώμενη πλευροποίηση με φασματικά επίπεδο θόρυβο σε δύο εντάσεις ήχου για έναν αντιπροσωπευτικό ακροατή. Και το πρόγραμμα 2S δείχνει τα ακατέργαστα δεδομένα (κύκλοι) και το προσαρμοσμένο μοντέλο NMLE (γραμμές) όλων των ακροατών.

Εντοπισμός ήχου: πώς ο εγκέφαλος αναγνωρίζει τις πηγές ήχου
Τραπέζι 1

Ο παραπάνω πίνακας δείχνει όλες τις παραμέτρους NLME. Μπορεί να φανεί ότι η αντιληπτή πλευρικότητα αυξήθηκε με την αύξηση της ITD, όπως περίμεναν οι επιστήμονες. Καθώς η ένταση του ήχου μειώθηκε, η αντίληψη μετατοπιζόταν όλο και περισσότερο προς τη μέση γραμμή (εισαγωγή στο γράφημα 2C).

Αυτές οι τάσεις υποστηρίχθηκαν από το μοντέλο NLME, το οποίο έδειξε σημαντικές επιδράσεις της ITD και της έντασης του ήχου στον μέγιστο βαθμό πλευρικότητας, υποστηρίζοντας το μοντέλο των μεσοημισφαιρικών διαφορών.

Επιπλέον, τα μέσα ακοομετρικά κατώφλια για καθαρούς τόνους είχαν μικρή επίδραση στην αντιληπτή πλευρικότητα. Όμως η ένταση του ήχου δεν επηρέασε σημαντικά τους δείκτες των ψυχομετρικών λειτουργιών.

Ο κύριος στόχος του δεύτερου πειράματος ήταν να προσδιοριστεί πώς θα άλλαζαν τα αποτελέσματα που προέκυψαν στο προηγούμενο πείραμα λαμβάνοντας υπόψη τα φασματικά χαρακτηριστικά των ερεθισμάτων (ήχους). Η ανάγκη δοκιμής για φασματικά επίπεδο θόρυβο σε χαμηλή ένταση ήχου είναι ότι μέρη του φάσματος μπορεί να μην ακούγονται και αυτό μπορεί να επηρεάσει τον προσδιορισμό της κατεύθυνσης του ήχου. Κατά συνέπεια, τα αποτελέσματα του πρώτου πειράματος μπορεί να μπερδευτούν εσφαλμένα για το γεγονός ότι το πλάτος του ακουστικού τμήματος του φάσματος μπορεί να μειωθεί με τη μείωση της έντασης του ήχου.

Ως εκ τούτου, αποφασίστηκε να διεξαχθεί ένα άλλο πείραμα, αλλά χρησιμοποιώντας το αντίστροφο Α-σταθμισμένο* θόρυβος

Α-ζύγιση* εφαρμόζεται στα επίπεδα ήχου για να ληφθεί υπόψη η σχετική ένταση που αντιλαμβάνεται το ανθρώπινο αυτί, καθώς το αυτί είναι λιγότερο ευαίσθητο στις χαμηλές συχνότητες ήχου. Η στάθμιση A υλοποιείται προσθέτοντας αριθμητικά έναν πίνακα τιμών που παρατίθενται σε ζώνες οκτάβας στα μετρούμενα επίπεδα ηχητικής πίεσης σε dB.

Στο γράφημα 2D δείχνει τα ακατέργαστα δεδομένα (κύκλοι) και τα προσαρμοσμένα με μοντέλο NMLE δεδομένα (γραμμές) όλων των συμμετεχόντων στο πείραμα.

Η ανάλυση των δεδομένων έδειξε ότι όταν όλα τα μέρη του ήχου είναι περίπου εξίσου ακουστικά (τόσο στην πρώτη όσο και στη δεύτερη δοκιμή), η αντιληπτή πλευρικότητα και η κλίση στο γράφημα που εξηγεί την αλλαγή της πλευρικότητας με την ITD μειώνεται με τη μείωση της έντασης του ήχου.

Έτσι, τα αποτελέσματα του δεύτερου πειράματος επιβεβαίωσαν τα αποτελέσματα του πρώτου. Δηλαδή, στην πράξη έχει αποδειχθεί ότι το μοντέλο που είχε προτείνει το 1948 ο Jeffress δεν είναι σωστό.

Αποδεικνύεται ότι ο εντοπισμός του ήχου χειροτερεύει καθώς μειώνεται η ένταση του ήχου και ο Jeffress πίστευε ότι οι ήχοι γίνονται αντιληπτοί και επεξεργάζονται από τον άνθρωπο με τον ίδιο τρόπο, ανεξάρτητα από την έντασή τους.

Για μια πιο λεπτομερή εξοικείωση με τις αποχρώσεις της μελέτης, συνιστώ να κοιτάξετε αναφέρουν οι επιστήμονες.

Επίλογος

Θεωρητικές υποθέσεις και πρακτικά πειράματα που τις επιβεβαιώνουν έχουν δείξει ότι οι νευρώνες του εγκεφάλου στα θηλαστικά ενεργοποιούνται με διαφορετικούς ρυθμούς ανάλογα με την κατεύθυνση του ηχητικού σήματος. Στη συνέχεια, ο εγκέφαλος συγκρίνει αυτές τις ταχύτητες μεταξύ όλων των νευρώνων που εμπλέκονται στη διαδικασία για να δημιουργήσει δυναμικά έναν χάρτη του ηχητικού περιβάλλοντος.

Το μοντέλο του Jeffresson δεν είναι στην πραγματικότητα 100% λάθος, καθώς μπορεί να χρησιμοποιηθεί για να περιγράψει τέλεια τον εντοπισμό της πηγής ήχου σε κουκουβάγιες αχυρώνα. Ναι, για τις κουκουβάγιες δεν έχει σημασία η ένταση του ήχου· σε κάθε περίπτωση, θα καθορίσουν τη θέση της πηγής του. Ωστόσο, αυτό το μοντέλο δεν λειτουργεί με πιθήκους rhesus, όπως έχουν δείξει προηγούμενα πειράματα. Επομένως, αυτό το μοντέλο του Jeffresson δεν μπορεί να περιγράψει τον εντοπισμό των ήχων για όλα τα ζωντανά όντα.

Πειράματα με ανθρώπους που συμμετέχουν επιβεβαίωσαν για άλλη μια φορά ότι ο εντοπισμός του ήχου συμβαίνει διαφορετικά σε διαφορετικούς οργανισμούς. Πολλοί από τους συμμετέχοντες δεν μπόρεσαν να προσδιορίσουν σωστά τη θέση της πηγής των ηχητικών σημάτων λόγω της χαμηλής έντασης των ήχων.

Οι επιστήμονες πιστεύουν ότι το έργο τους δείχνει ορισμένες ομοιότητες μεταξύ του πώς βλέπουμε και του πώς ακούμε. Και οι δύο διαδικασίες σχετίζονται με την ταχύτητα των νευρώνων σε διαφορετικά μέρη του εγκεφάλου, καθώς και με την αξιολόγηση αυτής της διαφοράς για τον προσδιορισμό τόσο της θέσης των αντικειμένων που βλέπουμε στο διάστημα όσο και της θέσης της πηγής του ήχου που ακούμε.

Στο μέλλον, οι ερευνητές πρόκειται να πραγματοποιήσουν μια σειρά πειραμάτων για να εξετάσουν λεπτομερέστερα τη σύνδεση μεταξύ ανθρώπινης ακοής και όρασης, κάτι που θα μας επιτρέψει να κατανοήσουμε καλύτερα πώς ακριβώς ο εγκέφαλός μας χτίζει δυναμικά έναν χάρτη του κόσμου γύρω μας.

Ευχαριστώ για την ανάγνωση, μείνετε περίεργοι και καλή εβδομάδα παιδιά! 🙂

Σας ευχαριστούμε που μείνατε μαζί μας. Σας αρέσουν τα άρθρα μας; Θέλετε να δείτε πιο ενδιαφέρον περιεχόμενο; Υποστηρίξτε μας κάνοντας μια παραγγελία ή προτείνοντας σε φίλους, cloud VPS για προγραμματιστές από 4.99 $, Έκπτωση 30% για χρήστες Habr σε ένα μοναδικό ανάλογο διακομιστών εισαγωγικού επιπέδου, που εφευρέθηκε από εμάς για εσάς: Όλη η αλήθεια για το VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps από 20 $ ή πώς να μοιραστείτε έναν διακομιστή; (διατίθεται με RAID1 και RAID10, έως 24 πυρήνες και έως 40 GB DDR4).

Dell R730xd 2 φορές φθηνότερο; Μόνο εδώ 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 Τηλεόραση από 199$ στην Ολλανδία! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - από 99$! Διαβάστε σχετικά Πώς να χτίσετε την υποδομή Corp. κατηγορίας με τη χρήση διακομιστών Dell R730xd E5-2650 v4 αξίας 9000 ευρώ για μια δεκάρα;

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο