Lokalizacja dźwięku: jak mózg rozpoznaje źródła dźwięku

Lokalizacja dźwięku: jak mózg rozpoznaje źródła dźwięku

Otaczający nas świat jest wypełniony wszelkiego rodzaju informacjami, które nasz mózg nieustannie przetwarza. Otrzymuje te informacje poprzez narządy zmysłów, z których każdy odpowiada za swoją część sygnałów: oczy (wzrok), język (smak), nos (węch), skóra (dotyk), narząd przedsionkowy (równowaga, położenie w przestrzeni i poczucie waga) i uszy (dźwięk). Łącząc sygnały ze wszystkich tych narządów, nasz mózg może zbudować dokładny obraz naszego otoczenia. Jednak nie wszystkie aspekty przetwarzania sygnałów zewnętrznych są nam znane. Jedną z tych tajemnic jest mechanizm lokalizacji źródła dźwięków.

Naukowcy z Laboratorium Neuroinżynierii Mowy i Słuchu (New Jersey Institute of Technology) zaproponowali nowy model neuronowego procesu lokalizacji dźwięku. Jakie dokładnie procesy zachodzą w mózgu podczas percepcji dźwięku, jak nasz mózg rozumie położenie źródła dźwięku i jak te badania mogą pomóc w walce z wadami słuchu. Dowiadujemy się o tym z raportu grupy badawczej. Iść.

Baza badawcza

Informacje, które nasz mózg otrzymuje od zmysłów, różnią się od siebie zarówno źródłem, jak i sposobem przetwarzania. Niektóre sygnały natychmiast pojawiają się w naszym mózgu jako dokładna informacja, inne natomiast wymagają dodatkowych procesów obliczeniowych. Z grubsza mówiąc, dotyk odczuwamy natychmiast, ale kiedy słyszymy dźwięk, wciąż musimy dowiedzieć się, skąd dochodzi.

Podstawą lokalizacji dźwięków w płaszczyźnie poziomej jest międzyuszne* różnica czasu (ITD od międzyuszna różnica czasu) dźwięki docierające do uszu słuchacza.

Podstawa międzyuszna* - odległość między uszami.

Za ten proces odpowiada specyficzny obszar w mózgu (przyśrodkowa górna oliwka, MSO). W momencie odebrania sygnału dźwiękowego w MVO międzyuszne różnice czasu przekształcają się w szybkość reakcji neuronów. Kształt krzywych prędkości wyjściowej MBO w funkcji ITD przypomina kształt funkcji korelacji krzyżowej sygnałów wejściowych dla każdego ucha.

Sposób przetwarzania i interpretacji informacji w MBO nie jest do końca jasny, dlatego istnieje kilka bardzo sprzecznych teorii. Najbardziej znaną, a właściwie klasyczną teorią lokalizacji dźwięku jest model Jeffressa (Lloyda A. Jeffressa). Opiera się na zaznaczona linia* neurony detektorowe wrażliwe na binauralną synchronizację sygnałów wejściowych neuronów z każdego ucha, przy czym każdy neuron jest maksymalnie wrażliwy na pewną ilość ITD ().

Zasada zaznaczonej linii* to hipoteza wyjaśniająca, w jaki sposób różne nerwy, z których wszystkie korzystają z tych samych zasad fizjologicznych w przekazywaniu impulsów wzdłuż aksonów, są w stanie generować różne wrażenia. Strukturalnie podobne nerwy mogą generować różne wrażenia zmysłowe, jeśli są połączone z unikalnymi neuronami w ośrodkowym układzie nerwowym, które są zdolne do dekodowania podobnych sygnałów nerwowych na różne sposoby.

Lokalizacja dźwięku: jak mózg rozpoznaje źródła dźwięku
Obraz nr 1

Model ten jest obliczeniowo podobny do kodowania neuronowego i opiera się na swobodnych korelacjach krzyżowych dźwięków docierających do obu uszu.

Istnieje również model sugerujący, że lokalizację dźwięku można modelować w oparciu o różnice w szybkości reakcji pewnych populacji neuronów z różnych półkul mózgu, tj. model asymetrii międzypółkulowej (1V).

Do tej pory trudno było jednoznacznie stwierdzić, która z dwóch teorii (modeli) jest poprawna, biorąc pod uwagę, że każda z nich przewiduje inne zależności lokalizacji dźwięku od natężenia dźwięku.

W badaniu, któremu się dzisiaj przyglądamy, naukowcy postanowili połączyć oba modele, aby zrozumieć, czy percepcja dźwięków opiera się na kodowaniu neuronowym, czy na różnicach w reakcjach poszczególnych populacji neuronowych. Przeprowadzono kilka eksperymentów, w których wzięły udział osoby w wieku od 18 do 27 lat (5 kobiet i 7 mężczyzn). Audiometria uczestników (pomiar ostrości słuchu) wynosiła 25 dB lub więcej w przedziale od 250 do 8000 Hz. Uczestnika eksperymentów umieszczono w dźwiękoszczelnym pomieszczeniu, w którym umieszczono specjalny sprzęt, skalibrowany z dużą dokładnością. Uczestnicy musieli po usłyszeniu sygnału dźwiękowego wskazać kierunek, z którego dochodził.

Wyniki badania

Aby ocenić zależność lateralizacja* aktywności mózgu na podstawie natężenia dźwięku w odpowiedzi na znakowane neurony, wykorzystano dane dotyczące szybkości reakcji neuronów w jądrze laminarnym mózgu płomykówki.

lateralizacja* - asymetria lewej i prawej połowy ciała.

Do oceny zależności lateralizacji aktywności mózgu od szybkości reakcji niektórych populacji neuronów wykorzystano dane z aktywności wzgórka dolnego mózgu małpy rezus, po czym dodatkowo obliczono różnice w szybkości neuronów z różnych półkul .

Model zaznaczonej linii neuronów detektora przewiduje, że wraz ze spadkiem natężenia dźwięku lateralność postrzeganego źródła będzie zbiegać się do średnich wartości podobnych do stosunku dźwięków cichych do głośnych (1S).

Z kolei model asymetrii półkuli sugeruje, że gdy natężenie dźwięku spada do poziomu bliskiego progowi, postrzegana lateralność przesunie się w kierunku linii środkowej (1D).

Przy wyższym ogólnym natężeniu dźwięku oczekuje się, że lateralizacja będzie niezmienna w natężeniu (wstawki w 1S и 1D).

Dlatego analiza wpływu natężenia dźwięku na postrzegany kierunek dźwięku pozwala dokładnie określić charakter procesów zachodzących w tym momencie - neurony z tego samego ogólnego obszaru, czy neurony z różnych półkul.

Jest oczywiste, że zdolność danej osoby do rozróżniania ITD może się różnić w zależności od natężenia dźwięku. Naukowcy twierdzą jednak, że trudno jest zinterpretować wcześniejsze ustalenia łączące czułość z ITD i oceną słuchaczy dotyczącą kierunku źródła dźwięku w funkcji natężenia dźwięku. Niektóre badania mówią, że gdy natężenie dźwięku osiąga próg graniczny, odczuwalna lateralność źródła maleje. Inne badania sugerują, że intensywność w ogóle nie wpływa na percepcję.

Inaczej mówiąc, naukowcy „delikatnie” dają do zrozumienia, że ​​w literaturze niewiele jest informacji na temat związku pomiędzy ITD, natężeniem dźwięku i określeniem kierunku jego źródła. Istnieją teorie, które istnieją jako swego rodzaju aksjomaty, ogólnie akceptowane przez środowisko naukowe. Dlatego postanowiono szczegółowo przetestować w praktyce wszystkie teorie, modele i możliwe mechanizmy percepcji słuchu.

Pierwszy eksperyment opierał się na paradygmacie psychofizycznym, który umożliwił badanie lateralizacji opartej na ITD w funkcji natężenia dźwięku w grupie dziesięciu osób prawidłowo słyszących.

Lokalizacja dźwięku: jak mózg rozpoznaje źródła dźwięku
Obraz nr 2

Źródła dźwięku zostały specjalnie dostrojone tak, aby obejmowały większość zakresu częstotliwości, w którym ludzie są w stanie wykryć ITD, tj. od 300 do 1200 Hz ().

W każdej próbie słuchacz musiał wskazać postrzeganą lateralność, mierzoną jako funkcję poziomu czucia, w zakresie wartości ITD od 375 do 375 ms. Aby określić wpływ natężenia dźwięku, zastosowano nieliniowy model efektów mieszanych (NMLE), który obejmował zarówno stałe, jak i losowe natężenie dźwięku.

Planować 2V pokazuje szacunkową lateralizację z widmowo płaskim szumem przy dwóch intensywnościach dźwięku dla reprezentatywnego słuchacza. I harmonogram 2S pokazuje surowe dane (okręgi) i dopasowany model NMLE (linie) wszystkich słuchaczy.

Lokalizacja dźwięku: jak mózg rozpoznaje źródła dźwięku
Tabela 1

Powyższa tabela przedstawia wszystkie parametry NLME. Można zauważyć, że zgodnie z oczekiwaniami naukowców postrzegana lateralizacja wzrastała wraz ze wzrostem ITD. W miarę zmniejszania się natężenia dźwięku percepcja przesuwała się coraz bardziej w stronę linii środkowej (wstawka na wykresie). 2C).

Tendencje te zostały poparte modelem NLME, który wykazał istotny wpływ ITD i natężenia dźwięku na maksymalny stopień lateralizacji, potwierdzając model różnic międzypółkulowych.

Ponadto średnie progi audiometryczne dla czystych tonów miały niewielki wpływ na postrzeganą lateralność. Jednak natężenie dźwięku nie wpływało istotnie na wskaźniki funkcji psychometrycznych.

Głównym celem drugiego eksperymentu było określenie, jak zmienią się wyniki uzyskane w poprzednim eksperymencie, jeśli uwzględni się cechy widmowe bodźców (dźwięków). Konieczność badania widmowo płaskiego szumu przy niskim natężeniu dźwięku wynika z faktu, że części widma mogą nie być słyszalne, co może mieć wpływ na określenie kierunku dźwięku. W konsekwencji wyniki pierwszego eksperymentu można błędnie pomylić z faktem, że szerokość słyszalnej części widma może zmniejszać się wraz ze zmniejszaniem się natężenia dźwięku.

Dlatego zdecydowano się przeprowadzić kolejny eksperyment, ale w odwrotnej kolejności ważona A* hałas

A-ważenie* stosowane do poziomów dźwięku w celu uwzględnienia względnej głośności odbieranej przez ludzkie ucho, ponieważ ucho jest mniej wrażliwe na niskie częstotliwości dźwięku. Ważenie A realizowane jest poprzez arytmetyczne dodanie tabeli wartości podanych w pasmach oktawowych do zmierzonych poziomów ciśnienia akustycznego w dB.

Na wykresie 2D pokazuje surowe dane (okręgi) i dane dopasowane do modelu NMLE (linie) wszystkich uczestników eksperymentu.

Analiza danych wykazała, że ​​gdy wszystkie części dźwięku są w przybliżeniu jednakowo słyszalne (zarówno w pierwszej, jak i drugiej próbie), postrzegana lateralność i nachylenie na wykresie wyjaśniającym zmianę lateralności wraz z ITD maleją wraz ze spadkiem natężenia dźwięku.

Tym samym wyniki drugiego eksperymentu potwierdziły wyniki pierwszego. Oznacza to, że w praktyce okazało się, że model zaproponowany w 1948 roku przez Jeffressa nie jest poprawny.

Okazuje się, że lokalizacja dźwięku pogarsza się wraz ze spadkiem natężenia dźwięku, a Jeffress uważał, że dźwięki są odbierane i przetwarzane przez człowieka w ten sam sposób, niezależnie od ich natężenia.

Aby uzyskać bardziej szczegółową znajomość niuansów badania, polecam przyjrzeć się donoszą naukowcy.

Epilog

Założenia teoretyczne i potwierdzające je eksperymenty praktyczne wykazały, że neurony mózgowe u ssaków ulegają aktywacji z różną szybkością w zależności od kierunku sygnału dźwiękowego. Następnie mózg porównuje te prędkości pomiędzy wszystkimi neuronami zaangażowanymi w proces, aby dynamicznie zbudować mapę środowiska dźwiękowego.

Model Jeffressona nie jest w istocie w 100% błędny, gdyż można go zastosować do doskonałego opisania lokalizacji źródła dźwięku u płomykówek. Tak, dla płomykówek natężenie dźwięku nie ma znaczenia, w każdym razie określą położenie jego źródła. Jednak model ten nie sprawdza się w przypadku rezusów, jak wykazały poprzednie eksperymenty. Dlatego ten model Jeffressona nie może opisać lokalizacji dźwięków dla wszystkich żywych istot.

Eksperymenty z udziałem ludzi po raz kolejny potwierdziły, że lokalizacja dźwięku przebiega różnie u różnych organizmów. Wielu uczestników nie było w stanie poprawnie określić położenia źródła sygnałów dźwiękowych ze względu na niskie natężenie dźwięków.

Naukowcy uważają, że ich prace wykazują pewne podobieństwa między tym, jak widzimy, a tym, jak słyszymy. Obydwa procesy związane są z prędkością neuronów w różnych częściach mózgu, a także z oceną tej różnicy w celu określenia zarówno położenia obiektów, które widzimy w przestrzeni, jak i położenia źródła dźwięku, który słyszymy.

W przyszłości naukowcy zamierzają przeprowadzić serię eksperymentów, które pozwolą bardziej szczegółowo zbadać powiązanie ludzkiego słuchu i wzroku, co pozwoli nam lepiej zrozumieć, w jaki sposób nasz mózg dynamicznie buduje mapę otaczającego nas świata.

Dziękuję za uwagę, bądźcie ciekawi i życzę wszystkim udanego tygodnia! 🙂

Dziękujemy za pobyt z nami. Podobają Ci się nasze artykuły? Chcesz zobaczyć więcej ciekawych treści? Wesprzyj nas składając zamówienie lub polecając znajomym, VPS w chmurze dla programistów od 4.99 USD, 30% zniżki dla użytkowników Habr na unikalny odpowiednik serwerów klasy podstawowej, który został przez nas wymyślony dla Ciebie: Cała prawda o VPS (KVM) E5-2650 v4 (6 rdzeni) 10GB DDR4 240GB SSD 1Gbps od 20$ czyli jak udostępnić serwer? (dostępne z RAID1 i RAID10, do 24 rdzeni i do 40 GB DDR4).

Dell R730xd 2 razy tańszy? Tylko tutaj 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64 GB DDR4 4x960 GB SSD 1 Gb/s 100 Telewizor od 199 USD w Holandii! Dell R420 — 2x E5-2430 2.2 GHz 6C 128 GB DDR3 2x960 GB SSD 1 Gb/s 100 TB — od 99 USD! Czytać o Jak zbudować firmę infrastrukturalną klasy z wykorzystaniem serwerów Dell R730xd E5-2650 v4 o wartości 9000 euro za grosz?

Źródło: www.habr.com

Dodaj komentarz