Lokalisasyon ng tunog: kung paano kinikilala ng utak ang mga mapagkukunan ng tunog

Lokalisasyon ng tunog: kung paano kinikilala ng utak ang mga mapagkukunan ng tunog

Ang mundo sa paligid natin ay puno ng lahat ng uri ng impormasyon na patuloy na pinoproseso ng ating utak. Natanggap niya ang impormasyong ito sa pamamagitan ng mga organo ng pandama, na ang bawat isa ay may pananagutan sa bahagi ng mga senyales nito: mga mata (pangitain), dila (panlasa), ilong (amoy), balat (hawakan), vestibular apparatus (balanse, posisyon sa espasyo at pakiramdam ng timbang) at tainga (tunog). Sa pamamagitan ng pagsasama-sama ng mga signal mula sa lahat ng mga organo na ito, ang ating utak ay maaaring bumuo ng isang tumpak na larawan ng ating kapaligiran. Ngunit hindi lahat ng aspeto ng pagproseso ng mga panlabas na signal ay alam sa amin. Ang isa sa mga lihim na ito ay ang mekanismo para sa pag-localize ng pinagmulan ng mga tunog.

Ang mga siyentipiko mula sa Laboratory of Neuroengineering of Speech and Hearing (New Jersey Institute of Technology) ay nagmungkahi ng isang bagong modelo ng neural na proseso ng sound localization. Anong mga eksaktong proseso ang nangyayari sa utak sa panahon ng pagdama ng tunog, kung paano naiintindihan ng ating utak ang posisyon ng pinagmumulan ng tunog, at kung paano makakatulong ang pananaliksik na ito sa paglaban sa mga depekto sa pandinig. Nalaman namin ang tungkol dito mula sa ulat ng pangkat ng pananaliksik. Pumunta ka.

Batayan sa pananaliksik

Ang impormasyong natatanggap ng ating utak mula sa ating mga pandama ay naiiba sa bawat isa, kapwa sa mga tuntunin ng pinagmulan nito at sa mga tuntunin ng pagproseso nito. Ang ilang mga signal ay agad na lumalabas sa ating utak bilang tumpak na impormasyon, habang ang iba ay nangangailangan ng karagdagang mga proseso ng pagkalkula. Sa halos pagsasalita, nakakaramdam tayo kaagad, ngunit kapag nakarinig tayo ng tunog, kailangan pa nating hanapin kung saan ito nanggaling.

Ang batayan para sa pag-localize ng mga tunog sa pahalang na eroplano ay interaural* pagkakaiba sa oras (ITD mula sa pagkakaiba sa oras ng interaural) mga tunog na umaabot sa tainga ng nakikinig.

Interaural base* - distansya sa pagitan ng mga tainga.

Mayroong isang partikular na lugar sa utak (ang medial superior olive o MSO) na responsable para sa prosesong ito. Sa sandaling natanggap ang sound signal sa MVO, ang mga pagkakaiba sa oras ng interaural ay na-convert sa rate ng reaksyon ng mga neuron. Ang hugis ng MBO output velocity curves bilang isang function ng ITD ay kahawig ng hugis ng cross-correlation function ng mga input signal para sa bawat tainga.

Kung paano pinoproseso at binibigyang-kahulugan ang impormasyon sa MBO ay nananatiling hindi lubos na malinaw, kaya naman mayroong ilang napakasalungat na teorya. Ang pinakatanyag at sa katunayan klasikal na teorya ng lokalisasyon ng tunog ay ang modelong Jeffress (Lloyd A. Jeffrey). Ito ay batay sa may markang linya* mga detektor na neuron na sensitibo sa binaural na synchrony ng mga neural input mula sa bawat tainga, na ang bawat neuron ay lubos na sensitibo sa isang tiyak na halaga ng ITD (1A).

May markang prinsipyo ng linya* ay isang hypothesis na nagpapaliwanag kung paano ang iba't ibang mga nerbiyos, na lahat ay gumagamit ng parehong mga prinsipyo ng physiological sa pagpapadala ng mga impulses kasama ang kanilang mga axon, ay nakakagawa ng iba't ibang mga sensasyon. Ang mga katulad na nerbiyos sa istruktura ay maaaring makabuo ng iba't ibang sensory perception kung konektado sila sa mga natatanging neuron sa central nervous system na may kakayahang mag-decode ng mga katulad na signal ng nerve sa iba't ibang paraan.

Lokalisasyon ng tunog: kung paano kinikilala ng utak ang mga mapagkukunan ng tunog
Larawan #1

Ang modelong ito ay computationally na katulad ng neural coding, batay sa walang limitasyong cross-correlations ng mga tunog na umaabot sa magkabilang tainga.

Mayroon ding isang modelo na nagmumungkahi na ang tunog na lokalisasyon ay maaaring mamodelo batay sa mga pagkakaiba sa bilis ng pagtugon ng ilang mga populasyon ng mga neuron mula sa iba't ibang hemispheres ng utak, i.e. modelo ng interhemispheric asymmetry (1V).

Hanggang ngayon, mahirap na malinaw na sabihin kung alin sa dalawang teorya (modelo) ang tama, dahil hinuhulaan ng bawat isa sa kanila ang iba't ibang mga dependency ng sound localization sa sound intensity.

Sa pag-aaral na tinitingnan natin ngayon, nagpasya ang mga mananaliksik na pagsamahin ang parehong mga modelo upang maunawaan kung ang pang-unawa ng mga tunog ay batay sa neural coding o sa mga pagkakaiba sa tugon ng mga indibidwal na populasyon ng neural. Ilang mga eksperimento ang isinagawa kung saan nakibahagi ang mga taong may edad 18 hanggang 27 taon (5 babae at 7 lalaki). Ang audiometry ng mga kalahok (isang pagsukat ng katalinuhan ng pandinig) ay 25 dB o mas mataas sa pagitan ng 250 at 8000 Hz. Ang kalahok sa mga eksperimento ay inilagay sa isang soundproofed na silid, kung saan inilagay ang mga espesyal na kagamitan, na na-calibrate na may mataas na katumpakan. Kinailangan ng mga kalahok, pagkarinig ng sound signal, ipahiwatig ang direksyon kung saan ito nanggaling.

Mga resulta ng pananaliksik

Upang masuri ang dependency pag-ilid* aktibidad ng utak mula sa intensity ng tunog bilang tugon sa mga may label na neuron, ginamit ang data sa bilis ng reaksyon ng mga neuron sa laminar nucleus ng utak ng barn owl.

Laterality* - kawalaan ng simetrya ng kaliwa at kanang bahagi ng katawan.

Upang masuri ang pag-asa ng lateralization ng aktibidad ng utak sa bilis ng reaksyon ng ilang mga populasyon ng mga neuron, ginamit ang data mula sa aktibidad ng inferior colliculus ng rhesus monkey brain, pagkatapos kung saan ang mga pagkakaiba-iba sa bilis ng mga neuron mula sa iba't ibang hemispheres ay karagdagang kinakalkula. .

Ang markang linya ng modelo ng mga neuron ng detector ay hinuhulaan na habang bumababa ang intensity ng tunog, ang pag-ilid ng pinagmumulan ay magsasama-sama sa mga halagang katumbas ng ratio ng malambot sa malalakas na tunog (1S).

Ang modelo ng hemispheric asymmetry, naman, ay nagmumungkahi na habang bumababa ang intensity ng tunog sa malapit na mga antas ng threshold, ang pinaghihinalaang laterality ay lilipat patungo sa midline (1D).

Sa mas mataas na pangkalahatang intensity ng tunog, ang lateralization ay inaasahang magiging intensity invariant (inset in 1S ΠΈ 1D).

Samakatuwid, ang pagsusuri kung paano nakakaapekto ang intensity ng tunog sa pinaghihinalaang direksyon ng tunog ay nagbibigay-daan sa amin upang tumpak na matukoy ang likas na katangian ng mga prosesong nagaganap sa sandaling iyon - mga neuron mula sa parehong pangkalahatang lugar o mga neuron mula sa iba't ibang hemispheres.

Maliwanag, ang kakayahan ng isang tao na magdiskrimina sa ITD ay maaaring mag-iba depende sa intensity ng tunog. Gayunpaman, sinasabi ng mga siyentipiko na mahirap bigyang-kahulugan ang mga nakaraang natuklasan na nag-uugnay sa pagiging sensitibo sa ITD at paghatol ng mga tagapakinig sa direksyon ng pinagmulan ng tunog bilang isang function ng intensity ng tunog. Ang ilang mga pag-aaral ay nagsasabi na kapag ang intensity ng tunog ay umabot sa isang hangganan ng hangganan, ang pinaghihinalaang laterality ng pinagmulan ay bumababa. Iminumungkahi ng iba pang mga pag-aaral na walang epekto ng intensity sa pang-unawa.

Sa madaling salita, ang mga siyentipiko ay "malumanay" na nagpapahiwatig na mayroong kaunting impormasyon sa panitikan tungkol sa relasyon sa pagitan ng ITD, intensity ng tunog at pagtukoy sa direksyon ng pinagmulan nito. May mga teorya na umiiral bilang isang uri ng mga axiom, na karaniwang tinatanggap ng komunidad ng siyensya. Samakatuwid, napagpasyahan na subukan nang detalyado ang lahat ng mga teorya, modelo at posibleng mekanismo ng pang-unawa sa pandinig sa pagsasanay.

Ang unang eksperimento ay batay sa isang psychophysical paradigm na nagpapahintulot sa pag-aaral ng ITD-based lateralization bilang isang function ng sound intensity sa isang grupo ng sampung normal na kalahok sa pagdinig.

Lokalisasyon ng tunog: kung paano kinikilala ng utak ang mga mapagkukunan ng tunog
Larawan #2

Ang mga pinagmumulan ng tunog ay partikular na nakatutok upang masakop ang karamihan sa saklaw ng dalas kung saan ang mga tao ay nakakakita ng ITD, ibig sabihin. mula 300 hanggang 1200 Hz (2A).

Sa bawat pagsubok, kailangang ipahiwatig ng tagapakinig ang pinaghihinalaang laterality, na sinusukat bilang isang function ng antas ng pandamdam, sa isang hanay ng mga halaga ng ITD mula 375 hanggang 375 ms. Upang matukoy ang epekto ng intensity ng tunog, ginamit ang isang nonlinear mixed effects model (NMLE) na kasama ang parehong fixed at random sound intensity.

Iskedyul 2V nagpapakita ng tinantyang lateralization na may kakaibang flat na ingay sa dalawang intensity ng tunog para sa isang kinatawan na tagapakinig. At ang iskedyul 2S ipinapakita ang raw data (mga bilog) at ang fitted na modelo ng NMLE (mga linya) ng lahat ng mga tagapakinig.

Lokalisasyon ng tunog: kung paano kinikilala ng utak ang mga mapagkukunan ng tunog
Talahanayan # 1

Ipinapakita ng talahanayan sa itaas ang lahat ng mga parameter ng NLME. Makikita na ang pinaghihinalaang laterality ay tumaas sa pagtaas ng ITD, gaya ng inaasahan ng mga siyentipiko. Habang bumababa ang intensity ng tunog, ang perception ay higit na lumipat patungo sa midline (inset sa graph 2C).

Ang mga trend na ito ay suportado ng modelong NLME, na nagpakita ng makabuluhang epekto ng ITD at sound intensity sa maximum na antas ng laterality, na sumusuporta sa modelo ng interhemispheric differences.

Bilang karagdagan, ang ibig sabihin ng mga audiometric na threshold para sa mga purong tono ay may kaunting epekto sa pinaghihinalaang laterality. Ngunit ang intensity ng tunog ay hindi makabuluhang nakakaapekto sa mga tagapagpahiwatig ng mga pag-andar ng psychometric.

Ang pangunahing layunin ng pangalawang eksperimento ay upang matukoy kung paano magbabago ang mga resulta na nakuha sa nakaraang eksperimento kapag isinasaalang-alang ang mga spectral na tampok ng stimuli (tunog). Ang pangangailangan na subukan para sa kakaibang patag na ingay sa mababang intensity ng tunog ay ang mga bahagi ng spectrum ay maaaring hindi marinig at ito ay maaaring makaapekto sa pagtukoy ng direksyon ng tunog. Dahil dito, ang mga resulta ng unang eksperimento ay maaaring magkamali sa katotohanan na ang lapad ng naririnig na bahagi ng spectrum ay maaaring bumaba sa pagbaba ng intensity ng tunog.

Samakatuwid, napagpasyahan na magsagawa ng isa pang eksperimento, ngunit gamit ang kabaligtaran A-weighted* ingay

A-pagtimbang* inilapat sa mga antas ng tunog upang isaalang-alang ang relatibong loudness na nakikita ng tainga ng tao, dahil ang tainga ay hindi gaanong sensitibo sa mababang mga frequency ng tunog. Ang A-weighting ay ipinapatupad sa pamamagitan ng arithmetically na pagdaragdag ng talahanayan ng mga value na nakalista sa mga octave band sa mga sinusukat na antas ng sound pressure sa dB.

Sa tsart 2D ipinapakita ang raw data (mga bilog) at ang NMLE model-fitted data (mga linya) ng lahat ng kalahok sa eksperimento.

Ang pagsusuri sa data ay nagpakita na kapag ang lahat ng bahagi ng tunog ay humigit-kumulang pantay na naririnig (kapwa sa una at sa pangalawang pagsubok), napapansin ang pag-ilid at ang slope sa graph na nagpapaliwanag ng pagbabago sa pag-ilid na may pagbaba ng ITD sa pagbaba ng intensity ng tunog.

Kaya, kinumpirma ng mga resulta ng pangalawang eksperimento ang mga resulta ng una. Iyon ay, sa pagsasagawa ay ipinakita na ang modelo na iminungkahi noong 1948 ni Jeffress ay hindi tama.

Lumalabas na lumalala ang sound localization habang bumababa ang intensity ng tunog, at naniniwala si Jeffress na ang mga tunog ay nakikita at pinoproseso ng mga tao sa parehong paraan, anuman ang intensity ng mga ito.

Para sa isang mas detalyadong kakilala sa mga nuances ng pag-aaral, inirerekumenda ko ang pagtingin sa ulat ng mga siyentipiko.

Epilogo

Ang mga teoretikal na pagpapalagay at praktikal na mga eksperimento na nagpapatunay sa kanila ay nagpakita na ang mga neuron ng utak sa mga mammal ay isinaaktibo sa iba't ibang mga rate depende sa direksyon ng signal ng tunog. Pagkatapos, ikinukumpara ng utak ang mga bilis na ito sa pagitan ng lahat ng mga neuron na kasangkot sa proseso upang dynamic na bumuo ng isang mapa ng sound environment.

Ang modelo ni Jeffresson ay talagang hindi 100% mali, dahil magagamit ito upang perpektong ilarawan ang lokalisasyon ng pinagmumulan ng tunog sa mga barn owl. Oo, para sa mga kuwago ng kamalig ang intensity ng tunog ay hindi mahalaga; sa anumang kaso, matutukoy nila ang posisyon ng pinagmulan nito. Gayunpaman, hindi gumagana ang modelong ito sa mga rhesus monkey, tulad ng ipinakita ng mga nakaraang eksperimento. Samakatuwid, hindi mailarawan ng modelong ito ni Jeffresson ang lokalisasyon ng mga tunog para sa lahat ng nabubuhay na bagay.

Ang mga eksperimento sa mga kalahok ng tao ay muling nakumpirma na ang tunog lokalisasyon ay nangyayari sa iba't ibang mga organismo. Marami sa mga kalahok ay hindi nagawang matukoy nang tama ang posisyon ng pinagmumulan ng mga sound signal dahil sa mababang intensity ng mga tunog.

Naniniwala ang mga siyentipiko na ang kanilang gawain ay nagpapakita ng ilang pagkakatulad sa pagitan ng kung paano natin nakikita at kung paano natin naririnig. Ang parehong mga proseso ay nauugnay sa bilis ng mga neuron sa iba't ibang bahagi ng utak, gayundin sa pagtatasa ng pagkakaibang ito upang matukoy ang parehong posisyon ng mga bagay na nakikita natin sa kalawakan at ang posisyon ng pinagmulan ng tunog na ating naririnig.

Sa hinaharap, ang mga mananaliksik ay magsasagawa ng isang serye ng mga eksperimento upang suriin nang mas detalyado ang koneksyon sa pagitan ng pandinig at pangitain ng tao, na magbibigay-daan sa amin upang mas maunawaan kung paano eksaktong dynamic na bumubuo ang aming utak ng isang mapa ng mundo sa paligid natin.

Salamat sa iyong pansin, manatiling mausisa at magkaroon ng magandang linggo sa lahat! πŸ™‚

Salamat sa pananatili sa amin. Gusto mo ba ang aming mga artikulo? Gustong makakita ng mas kawili-wiling nilalaman? Suportahan kami sa pamamagitan ng pag-order o pagrekomenda sa mga kaibigan, cloud VPS para sa mga developer mula sa $4.99, 30% na diskwento para sa mga gumagamit ng Habr sa isang natatanging analogue ng mga entry-level na server, na inimbento namin para sa iyo: Ang buong katotohanan tungkol sa VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps mula sa $20 o kung paano magbahagi ng server? (magagamit sa RAID1 at RAID10, hanggang 24 na core at hanggang 40GB DDR4).

Dell R730xd 2 beses na mas mura? Dito lang 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV mula $199 sa Netherlands! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - mula $99! Basahin ang tungkol sa Paano bumuo ng infrastructure corp. klase sa paggamit ng mga server ng Dell R730xd E5-2650 v4 na nagkakahalaga ng 9000 euro para sa isang sentimos?

Pinagmulan: www.habr.com

Magdagdag ng komento