Äänen lokalisointi: kuinka aivot tunnistavat äänilähteet

Äänen lokalisointi: kuinka aivot tunnistavat äänilähteet

Ympäröivä maailma on täynnä kaikenlaista tietoa, jota aivomme jatkuvasti käsittelevät. Hän vastaanottaa tämän tiedon aistielinten kautta, joista jokainen on vastuussa omasta osuudestaan ​​signaaleja: silmät (näkö), kieli (maku), nenä (haju), iho (kosketus), vestibulaarinen laite (tasapaino, asema avaruudessa ja aistit). paino) ja korvat (ääni). Yhdistämällä kaikkien näiden elinten signaaleja aivomme voivat rakentaa tarkan kuvan ympäristöstään. Emme kuitenkaan tunne kaikkia ulkoisten signaalien käsittelyn näkökohtia. Yksi näistä salaisuuksista on mekanismi äänilähteen paikallistamiseksi.

Tutkijat Laboratory of Neuroengineering of Speech and Hearingista (New Jersey Institute of Technology) ovat ehdottaneet uutta mallia äänen lokalisoinnin hermoprosessista. Mitä tarkat prosessit aivoissa tapahtuu äänen havaitsemisen aikana, kuinka aivomme ymmärtävät äänilähteen sijainnin ja miten tämä tutkimus voi auttaa taistelussa kuulovaurioita vastaan. Opimme tästä tutkimusryhmän raportista. Mennä.

Tutkimuspohja

Tieto, jonka aivomme vastaanottaa aisteistamme, eroaa toisistaan ​​sekä lähteensä että käsittelynsä suhteen. Jotkut signaalit näyttävät aivoillemme välittömästi tarkkoina tiedoksi, kun taas toiset vaativat lisälaskentaprosesseja. Karkeasti sanottuna tunnemme kosketuksen välittömästi, mutta kun kuulemme äänen, meidän on silti löydettävä, mistä se tulee.

Äänien paikantamisen perusta vaakatasossa on interaural* aikaero (ITD alkaen interaural aikaero) äänet pääsevät kuuntelijan korviin.

Interaural base* - korvien välinen etäisyys.

Aivoissa on tietty alue (mediaal superior oliivi tai MSO), joka on vastuussa tästä prosessista. Äänisignaalin vastaanottamisen hetkellä MVO:ssa interauraliset aikaerot muunnetaan neuronien reaktionopeudeksi. MVO-lähtönopeuskäyrien muoto ITD:n funktiona muistuttaa kunkin korvan tulosignaalien ristikorrelaatiofunktion muotoa.

Tietojen käsittely ja tulkinta MBO:ssa ei ole täysin selvää, minkä vuoksi on olemassa useita hyvin ristiriitaisia ​​teorioita. Tunnetuin ja itse asiassa klassinen teoria äänen lokalisoinnista on Jeffressin malli (Lloyd A. Jeffress). Se perustuu merkitty viiva* ilmaisinneuronit, jotka ovat herkkiä kummastakin korvasta tulevien hermotulojen binauraaliselle synkronoinnille, ja jokainen hermosolu on maksimaalisesti herkkä tietylle määrälle ITD ().

merkityn viivan periaate* on hypoteesi, joka selittää, kuinka eri hermot, jotka kaikki käyttävät samoja fysiologisia periaatteita välittäessään impulsseja pitkin aksonejaan, pystyvät synnyttämään erilaisia ​​tuntemuksia. Rakenteellisesti samanlaiset hermot voivat tuottaa erilaisia ​​aistihavaintoja, jos ne ovat yhteydessä keskushermoston ainutlaatuisiin hermosoluihin, jotka pystyvät dekoodaamaan samanlaisia ​​hermosignaaleja eri tavoin.

Äänen lokalisointi: kuinka aivot tunnistavat äänilähteet
Kuva #1

Tämä malli on laskennallisesti samanlainen kuin hermokoodaus, joka perustuu molempiin korviin pääsevien äänten rajoittamattomiin ristikorrelaatioihin.

On myös malli, joka viittaa siihen, että äänen lokalisointia voidaan mallintaa perustuen eroihin tiettyjen aivojen eri puolilla olevien neuronipopulaatioiden vastenopeuksissa, ts. puolipallojen välisen epäsymmetrian malli (1V).

Tähän asti oli vaikea sanoa yksiselitteisesti, kumpi kahdesta teoriasta (mallista) on oikea, koska kukin niistä ennustaa äänen lokalisoinnin erilaisia ​​riippuvuuksia äänen intensiteetistä.

Tänään tarkastelemassamme tutkimuksessa tutkijat päättivät yhdistää molemmat mallit ymmärtääkseen, perustuuko äänien havaitseminen hermokoodaukseen vai yksittäisten hermopopulaatioiden vasteiden eroihin. Suoritettiin useita kokeita, joihin osallistui 18-27-vuotiaita henkilöitä (5 naista ja 7 miestä). Osallistujien audiometria (kuulontarkkuuden mittaus) oli 25 dB tai korkeampi välillä 250-8000 Hz. Kokeisiin osallistuja sijoitettiin äänieristettyyn huoneeseen, johon sijoitettiin erikoislaitteet, jotka oli kalibroitu suurella tarkkuudella. Äänimerkin kuultuaan osallistujien oli ilmoitettava suunta, josta se tuli.

Tutkimuksen tulokset

Arvioimaan riippuvuutta lateralisointi* aivojen aktiivisuutta äänen voimakkuudesta vasteena leimatuille hermosoluille, käytettiin tietoa pöllön aivojen laminaarisen ytimen hermosolujen reaktionopeudesta.

Lateraalisuus* - kehon vasemman ja oikean puoliskon epäsymmetria.

Arvioidakseen aivojen toiminnan lateralisoitumisen riippuvuutta tiettyjen neuronipopulaatioiden reaktionopeudesta käytettiin reesusapinan aivojen alemman kollikuluksen aktiivisuutta koskevia tietoja, minkä jälkeen laskettiin lisäksi erot eri puolipallojen hermosolujen nopeuksissa. .

Ilmaisinneuronien merkitty viivamalli ennustaa, että äänen intensiteetin pienentyessä havaitun lähteen lateraalisuus konvergoi keskiarvoihin, jotka ovat samanlaisia ​​kuin pehmeiden ja kovien äänien suhde (1S).

Puolipallon epäsymmetriamalli puolestaan ​​viittaa siihen, että kun äänen intensiteetti laskee lähelle kynnystasoja, havaittu lateraalisuus siirtyy kohti keskiviivaa (1D).

Korkeammalla kokonaisäänenvoimakkuudella lateralisoinnin odotetaan olevan intensiteettiinvarianttia 1S и 1D).

Siksi analysoimalla, kuinka äänen intensiteetti vaikuttaa havaittuun äänen suuntaan, voimme määrittää tarkasti sillä hetkellä tapahtuvien prosessien luonteen - hermosolut samalta yleisalueelta tai hermosolut eri puolipalloilta.

On selvää, että henkilön kyky syrjiä ITD:tä voi vaihdella äänenvoimakkuuden mukaan. Tiedemiehet sanovat kuitenkin, että on vaikea tulkita aikaisempia havaintoja, jotka yhdistävät herkkyyden ITD:hen ja kuuntelijoiden arviota äänilähteen suunnasta äänen voimakkuuden funktiona. Jotkut tutkimukset sanovat, että kun äänen intensiteetti saavuttaa rajakynnyksen, lähteen havaittu lateraalisuus vähenee. Muut tutkimukset viittaavat siihen, että intensiteetillä ei ole vaikutusta havaintoon ollenkaan.

Toisin sanoen tutkijat vihjaavat "hellästi", että kirjallisuudessa on vähän tietoa ITD:n, äänenvoimakkuuden ja sen lähteen suunnan välisestä suhteesta. On teorioita, jotka ovat olemassa eräänlaisina aksioomeina, jotka tiedeyhteisö on yleisesti hyväksynyt. Siksi päätettiin testata yksityiskohtaisesti kaikkia kuuloaistin teorioita, malleja ja mahdollisia mekanismeja käytännössä.

Ensimmäinen koe perustui psykofyysiseen paradigmaan, joka mahdollisti ITD-pohjaisen lateralisoinnin tutkimuksen äänenvoimakkuuden funktiona kymmenen normaalikuuloisen osallistujan ryhmässä.

Äänen lokalisointi: kuinka aivot tunnistavat äänilähteet
Kuva #2

Äänilähteet on erityisesti viritetty kattamaan suurimman osan taajuusalueesta, jolla ihmiset pystyvät tunnistamaan ITD:n, ts. 300 - 1200 Hz ().

Jokaisessa kokeessa kuuntelijan oli ilmoitettava havaittu lateraalisuus, mitattuna aistinvaraisen tason funktiona ITD-arvojen alueella 375-375 ms. Äänenvoimakkuuden vaikutuksen määrittämiseen käytettiin epälineaarista sekaefektimallia (NMLE), joka sisälsi sekä kiinteän että satunnaisen äänenvoimakkuuden.

Aikataulu 2V osoittaa arvioitua lateralisaatiota spektraalisesti tasaisella kohinalla kahdella äänenvoimakkuudella edustavalle kuuntelijalle. Ja aikataulu 2S näyttää kaikkien kuuntelijoiden raakatiedot (ympyrät) ja sovitetun NMLE-mallin (viivat).

Äänen lokalisointi: kuinka aivot tunnistavat äänilähteet
Pöytä 1

Yllä oleva taulukko näyttää kaikki NLME-parametrit. Voidaan nähdä, että havaittu lateraalisuus lisääntyi ITD:n kasvaessa, kuten tutkijat odottivat. Äänen intensiteetin pienentyessä havainto siirtyi yhä enemmän kohti keskiviivaa (kuvaajan sisään 2C).

Näitä suuntauksia tuki NLME-malli, joka osoitti ITD:n ja äänenvoimakkuuden merkittäviä vaikutuksia lateraalisuuden maksimiasteeseen, mikä tuki pallonpuoliskosten välisten erojen mallia.

Lisäksi puhtaiden äänien keskimääräisillä audiometrisillä kynnyksillä oli vain vähän vaikutusta havaittuun lateraalisuuteen. Mutta äänen intensiteetti ei vaikuttanut merkittävästi psykometristen toimintojen indikaattoreihin.

Toisen kokeen päätavoitteena oli selvittää, miten edellisessä kokeessa saadut tulokset muuttuisivat, kun otetaan huomioon ärsykkeiden (äänien) spektriominaisuudet. Tarve testata spektraalisesti tasaista kohinaa alhaisella äänenvoimakkuudella on se, että spektrin osat eivät ehkä ole kuultavissa ja tämä voi vaikuttaa äänen suunnan määrittämiseen. Näin ollen ensimmäisen kokeen tulokset voidaan virheellisesti erehtyä erehtymään siihen, että spektrin kuuluvan osan leveys voi pienentyä äänen intensiteetin pienentyessä.

Siksi päätettiin tehdä toinen koe, mutta käyttämällä päinvastaista A-painotettu* melua

A-punnitus* sovelletaan äänitasoihin ihmiskorvan havaitseman suhteellisen voimakkuuden huomioon ottamiseksi, koska korva on vähemmän herkkä matalille äänitaajuuksille. A-painotus toteutetaan lisäämällä aritmeettisesti mitattujen äänenpainetasojen desibeleinä oktaavikaistoina lueteltujen arvojen taulukko.

Kaaviossa 2D näyttää kaikkien kokeen osallistujien raakatiedot (ympyrät) ja NMLE-malliin sovitetut tiedot (viivat).

Tietojen analysointi osoitti, että kun äänen kaikki osat ovat suunnilleen yhtä kuultavissa (sekä ensimmäisessä että toisessa kokeessa), havaittu lateraalisuus ja ITD:n aiheuttamaa lateraalisuuden muutosta selittävän kaavion kaltevuus pienenevät äänenvoimakkuuden pienentyessä.

Siten toisen kokeen tulokset vahvistivat ensimmäisen tulokset. Eli käytännössä on osoitettu, että Jeffressin vuonna 1948 ehdottama malli ei ole oikea.

Osoittautuu, että äänen lokalisointi huononee äänen voimakkuuden pienentyessä, ja Jeffress uskoi, että ihmiset havaitsevat ja käsittelevät äänet samalla tavalla niiden voimakkuudesta riippumatta.

Jos haluat tutustua tarkemmin tutkimuksen vivahteisiin, suosittelen katsomaan tutkijat raportoivat.

Epilogi

Teoreettiset oletukset ja niitä vahvistavat käytännön kokeet ovat osoittaneet, että nisäkkäiden aivohermosolut aktivoituvat eri nopeuksilla äänisignaalin suunnasta riippuen. Aivot vertaavat sitten näitä nopeuksia kaikkien prosessiin osallistuvien neuronien välillä rakentaakseen dynaamisesti ääniympäristön kartan.

Jeffressonin malli ei itse asiassa ole 100 % väärä, sillä sen avulla voidaan kuvata täydellisesti äänilähteen sijaintia pöllöissä. Kyllä, pöllöille äänen voimakkuudella ei ole väliä; joka tapauksessa ne määrittävät sen lähteen sijainnin. Tämä malli ei kuitenkaan toimi reesusapinoiden kanssa, kuten aikaisemmat kokeet ovat osoittaneet. Siksi tämä Jeffresson-malli ei voi kuvata kaikkien elävien äänten lokalisointia.

Ihmisten kanssa tehdyt kokeet ovat jälleen kerran vahvistaneet, että äänen lokalisaatio tapahtuu eri tavalla eri organismeissa. Monet osallistujista eivät pystyneet määrittämään oikein äänisignaalien lähteen sijaintia äänien alhaisen intensiteetin vuoksi.

Tiedemiehet uskovat, että heidän työnsä osoittaa tiettyjä yhtäläisyyksiä sen välillä, miten näemme ja kuinka kuulemme. Molemmat prosessit liittyvät hermosolujen nopeuteen aivojen eri osissa sekä tämän eron arviointiin, jotta voidaan määrittää sekä avaruudessa näkemiemme kohteiden sijainti että kuulemamme äänen lähteen sijainti.

Tulevaisuudessa tutkijat aikovat tehdä sarjan kokeita, joissa tutkitaan tarkemmin ihmisen kuulon ja näön välistä yhteyttä, mikä antaa meille mahdollisuuden ymmärtää paremmin, kuinka tarkalleen aivomme rakentavat dynaamisesti karttaa ympäröivästä maailmasta.

Kiitos huomiosta, pysykää utelias ja mukavaa viikkoa kaikille! 🙂

Kiitos, että pysyt kanssamme. Pidätkö artikkeleistamme? Haluatko nähdä mielenkiintoisempaa sisältöä? Tue meitä tekemällä tilauksen tai suosittelemalla ystäville, pilvi VPS kehittäjille alkaen 4.99 dollaria, 30 %:n alennus Habr-käyttäjille ainutlaatuisesta lähtötason palvelimien analogista, jonka me keksimme sinulle: Koko totuus VPS (KVM) E5-2650 v4 (6 ydintä) 10 Gt DDR4 240 Gt SSD 1 Gbps alkaen 20 dollarista tai kuinka jakaa palvelin? (saatavana RAID1:n ja RAID10:n kanssa, jopa 24 ydintä ja jopa 40 Gt DDR4-muistia).

Dell R730xd 2 kertaa halvempi? Vain täällä 2 x Intel TetraDeca-Core Xeon 2 x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV alkaen 199 dollaria Alankomaissa! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - alkaen 99 dollaria! Lukea Kuinka rakentaa infrastruktuuriyritys. luokkaa Dell R730xd E5-2650 v4 -palvelimilla 9000 euron arvosta penniä vastaan?

Lähde: will.com

Lisää kommentti