Lokalizace zvuku: jak mozek rozpoznává zdroje zvuku

Lokalizace zvuku: jak mozek rozpoznává zdroje zvuku

Svět kolem nás je plný nejrůznějších informací, které náš mozek neustále zpracovává. Tyto informace přijímá prostřednictvím smyslových orgánů, z nichž každý je zodpovědný za svůj podíl signálů: oči (zrak), jazyk (chuť), nos (čich), kůže (hmat), vestibulární aparát (rovnováha, poloha v prostoru a smysl pro hmotnost) a uši (zvuk). Kombinací signálů ze všech těchto orgánů si náš mozek dokáže vytvořit přesný obraz našeho prostředí. Ale ne všechny aspekty zpracování externích signálů jsou nám známy. Jedním z těchto tajemství je mechanismus pro lokalizaci zdroje zvuků.

Vědci z Laboratory of Neuroengineering of Speech and Hearing (New Jersey Institute of Technology) navrhli nový model neurálního procesu lokalizace zvuku. Jaké přesné procesy probíhají v mozku při vnímání zvuku, jak náš mozek chápe polohu zdroje zvuku a jak může tento výzkum pomoci v boji proti sluchovým vadám. O tom se dozvídáme ze zprávy výzkumné skupiny. Jít.

Výzkumná základna

Informace, které náš mozek přijímá z našich smyslů, se od sebe liší, a to jak z hlediska jejich zdroje, tak z hlediska jejich zpracování. Některé signály se našemu mozku okamžitě objeví jako přesné informace, zatímco jiné vyžadují další výpočetní procesy. Zhruba řečeno, dotek cítíme okamžitě, ale když slyšíme zvuk, stále musíme najít, odkud přichází.

Základem pro lokalizaci zvuků v horizontální rovině je interaurální* časový rozdíl (ITD od interaurální časový rozdíl) zvuky doléhající k uším posluchače.

Interaurální základna* - vzdálenost mezi ušima.

Existuje specifická oblast v mozku (medial superior olive nebo MSO), která je zodpovědná za tento proces. V okamžiku příjmu audio signálu v MVO jsou interaurální časové rozdíly převedeny na reakční rychlost neuronů. Tvar křivek výstupní rychlosti MVO jako funkce ITD připomíná tvar funkce vzájemné korelace vstupních signálů pro každé ucho.

Jak jsou informace zpracovávány a interpretovány v MBO, není zcela jasné, a proto existuje několik velmi protichůdných teorií. Nejznámější a vlastně klasickou teorií lokalizace zvuku je Jeffressův model (Lloyd A. Jeffress). Je to založeno na označená čára* detektorové neurony, které jsou citlivé na binaurální synchronii nervových vstupů z každého ucha, přičemž každý neuron je maximálně citlivý na určité množství ITD ().

Princip vyznačené čáry* je hypotéza, která vysvětluje, jak různé nervy, z nichž všechny používají stejné fyziologické principy při přenosu impulsů podél svých axonů, jsou schopny generovat různé pocity. Strukturálně podobné nervy mohou generovat různé smyslové vjemy, pokud jsou spojeny s jedinečnými neurony v centrálním nervovém systému, které jsou schopny dekódovat podobné nervové signály různými způsoby.

Lokalizace zvuku: jak mozek rozpoznává zdroje zvuku
Obrázek č. 1

Tento model je výpočetně podobný neurálnímu kódování, založeném na neomezených vzájemných korelacích zvuků zasahujících do obou uší.

Existuje také model, který naznačuje, že lokalizaci zvuku lze modelovat na základě rozdílů v rychlosti odezvy určitých populací neuronů z různých hemisfér mozku, tzn. model interhemisférické asymetrie (1V).

Doposud bylo obtížné jednoznačně určit, která z obou teorií (modelů) je správná, vzhledem k tomu, že každá z nich předpovídá různé závislosti lokalizace zvuku na intenzitě zvuku.

Ve studii, na kterou se dnes díváme, se vědci rozhodli oba modely zkombinovat, aby pochopili, zda je vnímání zvuků založeno na neurálním kódování nebo na rozdílech v reakci jednotlivých neurálních populací. Bylo provedeno několik experimentů, kterých se účastnili lidé ve věku 18 až 27 let (5 žen a 7 mužů). Audiometrie účastníků (měření ostrosti sluchu) byla 25 dB nebo vyšší mezi 250 a 8000 Hz. Účastník experimentů byl umístěn do zvukotěsné místnosti, ve které bylo umístěno speciální zařízení, kalibrované s vysokou přesností. Účastníci museli po zaslechnutí zvukového signálu označit směr, odkud přichází.

Výsledky výzkumu

K posouzení závislosti lateralizace* mozková aktivita od intenzity zvuku v reakci na označené neurony, byly použity údaje o rychlosti reakce neuronů v laminárním jádru mozku sovy pálené.

Lateralita* - asymetrie levé a pravé poloviny těla.

Pro posouzení závislosti lateralizace mozkové aktivity na reakční rychlosti určitých populací neuronů byla použita data z aktivity inferior colliculus mozku opice rhesus, načež byly dodatečně vypočteny rozdíly v rychlosti neuronů z různých hemisfér. .

Model označených linií detektorových neuronů předpovídá, že jak intenzita zvuku klesá, lateralita vnímaného zdroje bude konvergovat ke středním hodnotám podobným poměru tichých a hlasitých zvuků (1S).

Model hemisférické asymetrie zase naznačuje, že jak intenzita zvuku klesá na úroveň blízko prahu, vnímaná lateralita se posune směrem ke střední čáře (1D).

Při vyšší celkové intenzitě zvuku se očekává, že lateralizace bude invariantní (vložky v 1S и 1D).

Proto analýza toho, jak intenzita zvuku ovlivňuje vnímaný směr zvuku, nám umožňuje přesně určit povahu procesů probíhajících v daném okamžiku - neurony ze stejné obecné oblasti nebo neurony z různých hemisfér.

Je zřejmé, že schopnost člověka rozlišovat ITD se může lišit v závislosti na intenzitě zvuku. Vědci však tvrdí, že je obtížné interpretovat předchozí zjištění spojující citlivost s ITD a úsudek posluchačů o směru zdroje zvuku jako funkci intenzity zvuku. Některé studie říkají, že když intenzita zvuku dosáhne hraničního prahu, sníží se vnímaná lateralita zdroje. Jiné studie naznačují, že intenzita na vnímání nemá vůbec žádný vliv.

Jinými slovy, vědci „jemně“ naznačují, že v literatuře je málo informací o vztahu mezi ITD, intenzitou zvuku a určením směru jeho zdroje. Existují teorie, které existují jako jakési axiomy, obecně přijímané vědeckou komunitou. Proto bylo rozhodnuto podrobně otestovat všechny teorie, modely a možné mechanismy sluchového vnímání v praxi.

První experiment byl založen na psychofyzickém paradigmatu, které umožnilo studium lateralizace založené na ITD jako funkce intenzity zvuku ve skupině deseti normálně slyšících účastníků.

Lokalizace zvuku: jak mozek rozpoznává zdroje zvuku
Obrázek č. 2

Zdroje zvuku byly speciálně vyladěny tak, aby pokryly většinu frekvenčního rozsahu, ve kterém jsou lidé schopni rozpoznat ITD, tzn. od 300 do 1200 Hz ().

Při každém pokusu musel posluchač označit vnímanou lateralitu, měřenou jako funkce úrovně vjemu, v rozsahu hodnot ITD od 375 do 375 ms. K určení vlivu intenzity zvuku byl použit model nelineárních smíšených efektů (NMLE), který zahrnoval jak pevnou, tak náhodnou intenzitu zvuku.

Naplánovat 2V demonstruje odhadovanou lateralizaci se spektrálně plochým šumem při dvou intenzitách zvuku pro reprezentativního posluchače. A rozvrh 2S zobrazuje nezpracovaná data (kruhy) a přizpůsobený model NMLE (řádky) všech posluchačů.

Lokalizace zvuku: jak mozek rozpoznává zdroje zvuku
Stůl 1

Výše uvedená tabulka zobrazuje všechny parametry NLME. Je vidět, že vnímaná lateralita rostla s rostoucí ITD, jak vědci očekávali. Jak se intenzita zvuku snižovala, vnímání se stále více posouvalo směrem ke střední čáře (vloženo do grafu 2C).

Tyto trendy byly podpořeny modelem NLME, který prokázal významné účinky ITD a intenzity zvuku na maximální míru laterality, podporující model interhemisférických rozdílů.

Navíc střední audiometrické prahy pro čisté tóny měly malý vliv na vnímanou lateralitu. Intenzita zvuku však ukazatele psychometrických funkcí významně neovlivnila.

Hlavním cílem druhého experimentu bylo zjistit, jak se změní výsledky získané v předchozím experimentu při zohlednění spektrálních vlastností podnětů (zvuků). Potřeba testovat spektrálně plochý šum při nízké intenzitě zvuku spočívá v tom, že části spektra nemusí být slyšitelné a to může ovlivnit určení směru zvuku. Výsledky prvního experimentu mohou být následně mylně zaměněny za to, že šířka slyšitelné části spektra se může s klesající intenzitou zvuku zmenšovat.

Proto bylo rozhodnuto provést další experiment, ale obráceně A-vážený* hluk

A-vážení* aplikované na hladiny zvuku, aby se vzala v úvahu relativní hlasitost vnímaná lidským uchem, protože ucho je méně citlivé na nízké zvukové frekvence. A-vážení je realizováno aritmetickým přičtením tabulky hodnot uvedených v oktávových pásmech k naměřeným hladinám akustického tlaku v dB.

Na grafu 2D ukazuje nezpracovaná data (kruhy) a data (čáry) přizpůsobená modelu NMLE všech účastníků experimentu.

Analýza dat ukázala, že když jsou všechny části zvuku přibližně stejně slyšitelné (jak v prvním, tak ve druhém pokusu), vnímaná lateralita a sklon v grafu vysvětlující změnu laterality s ITD klesají s klesající intenzitou zvuku.

Výsledky druhého experimentu tedy potvrdily výsledky prvního. To znamená, že v praxi se ukázalo, že model navržený v roce 1948 Jeffressem není správný.

Ukazuje se, že lokalizace zvuku se zhoršuje se snižováním intenzity zvuku a Jeffress věřil, že zvuky jsou vnímány a zpracovávány lidmi stejným způsobem, bez ohledu na jejich intenzitu.

Pro podrobnější seznámení s nuancemi studie doporučuji nahlédnout hlásí vědci.

Epilog

Teoretické předpoklady a praktické experimenty, které je potvrzují, ukázaly, že mozkové neurony u savců jsou aktivovány různou rychlostí v závislosti na směru zvukového signálu. Mozek pak porovná tyto rychlosti mezi všemi neurony zapojenými do procesu, aby dynamicky vytvořil mapu zvukového prostředí.

Jeffressonův model vlastně není 100% chybný, protože s ním lze dokonale popsat lokalizaci zdroje zvuku u sov pálených. Ano, u sov pálených na intenzitě zvuku nezáleží, v každém případě určí polohu jeho zdroje. Tento model však nefunguje s opicemi rhesus, jak ukázaly předchozí experimenty. Proto tento Jeffressonův model nemůže popsat lokalizaci zvuků pro všechny živé věci.

Experimenty s lidskými účastníky opět potvrdily, že lokalizace zvuku se v různých organismech vyskytuje odlišně. Mnozí z účastníků nedokázali správně určit polohu zdroje zvukových signálů z důvodu nízké intenzity zvuků.

Vědci se domnívají, že jejich práce vykazuje určité podobnosti mezi tím, jak vidíme a jak slyšíme. Oba procesy jsou spojeny s rychlostí neuronů v různých částech mozku a také s posouzením tohoto rozdílu pro určení jak polohy objektů, které vidíme v prostoru, tak polohy zdroje zvuku, který slyšíme.

V budoucnu se vědci chystají provést řadu experimentů, aby podrobněji prozkoumali spojení mezi lidským sluchem a zrakem, což nám umožní lépe pochopit, jak přesně náš mozek dynamicky vytváří mapu světa kolem nás.

Děkuji za pozornost, buďte zvědaví a přeji všem krásný týden! 🙂

Děkujeme, že s námi zůstáváte. Líbí se vám naše články? Chcete vidět více zajímavého obsahu? Podpořte nás objednávkou nebo doporučením přátelům, cloud VPS pro vývojáře od 4.99 $, 30% sleva pro uživatele Habr na unikátní obdobu entry-level serverů, kterou jsme pro vás vymysleli: Celá pravda o VPS (KVM) E5-2650 v4 (6 jader) 10GB DDR4 240GB SSD 1Gbps od 20 $ nebo jak sdílet server? (k dispozici s RAID1 a RAID10, až 24 jader a až 40 GB DDR4).

Dell R730xd 2x levnější? Pouze zde 2 x Intel TetraDeca-Core Xeon 2 x E5-2697v3 2.6 GHz 14C 64 GB DDR4 4 x 960 GB SSD 1 Gbps 100 TV od 199 USD V Nizozemsku! Dell R420 – 2x E5-2430 2.2 GHz 6C 128 GB DDR3 2 x 960 GB SSD 1 Gb/s 100 TB – od 99 $! Číst o Jak budovat infrastrukturu corp. třídy s využitím serverů Dell R730xd E5-2650 v4 v hodnotě 9000 XNUMX eur za cent?

Zdroj: www.habr.com

Přidat komentář