Локалізація звуків: як мозок розпізнає джерела звуків

Локалізація звуків: як мозок розпізнає джерела звуків

Світ, що оточує нас, сповнений всілякої інформації, яку наш мозок безперервно обробляє. Отримує він цю інформацію за допомогою органів чуття, кожен з яких відповідає за свою частку сигналів: очі (зір), мова (смак), ніс (нюх), шкіра (дотик), вестибулярний апарат (рівновагу, становище у просторі та почуття ваги) та вуха (звук). Зібравши докупи сигнали від усіх цих органів, наш мозок може побудувати точну картину навколишнього середовища. Але далеко не всі аспекти обробки зовнішніх сигналів нам відомі. Однією з таких таємниць є механізм локалізації джерела звуків.

Вчені з лабораторії нейроінженерії мови та слуху (технологічний інститут Нью-Джерсі) запропонували нову модель нейронного процесу локалізації звуку. Які саме процеси протікають у головному мозку під час сприйняття звуку, як наш мозок розуміє становище джерела звуку та як це дослідження може допомогти у боротьбі з дефектами слуху. Про це ми дізнаємось із доповіді дослідницької групи. Поїхали.

Основа дослідження

Інформація, яку отримує наш мозок від органів чуття, відрізняється один від одного як з погляду джерела, так і з точки зору її обробки. Одні сигнали відразу постають перед нашим мозком у вигляді точної інформації, інші потребують додаткових обчислювальних процесів. Грубо кажучи, дотик ми відчуваємо відразу, а ось почувши звук, нам доведеться ще знайти, звідки він виходить.

Основою локалізації звуків у горизонтальній площині є інтеруральна* різниця в часі (ITD від interaural time difference) звуків, що досягають вух слухача.

Інтерауральна база* - Відстань між вухами.

У головному мозку є певна ділянка (медіальна верхня олива або МВО), яка відповідає за цей процес. У момент отримання звукового сигналу МВО відбувається перетворення інтерураальних різниць у часі в швидкість реакції нейронів. Форма кривих швидкості вихідного сигналу МВО як функції ITD нагадує форму взаємно-кореляційну функцію вхідних сигналів для кожного вуха.

Те, як обробляється та інтерпретується інформація в МВО, залишається не до кінця ясним, через що існує кілька дуже суперечливих теорій. Найвідомішою і за фактом класичною теорією локалізації звуку є модель Джеффресса (Lloyd A. Jeffress). Вона заснована на маркованої лінії* нейронів-детекторів, які чутливі до бінауральної синхронності нейронних вхідних сигналів від кожного вуха, причому кожен нейрон максимально чутливий до певної величини ITD ().

Принцип маркованої лінії* — гіпотеза, яка пояснює, як різні нерви, всі з яких використовують одні й самі фізіологічні принципи під час передачі імпульсів уздовж своїх аксонів, здатні генерувати різні відчуття. Структурно подібні нерви можуть генерувати різні сенсорні сприйняття, якщо вони пов'язані з унікальними нейронами в центральній нервовій системі, здатні декодувати подібні нервові сигнали різними способами.

Локалізація звуків: як мозок розпізнає джерела звуків
Зображення №1

Дана модель у обчислювальному плані схожа на нейронне кодування, засноване на необмежених взаємних кореляціях звуків, що досягають обох вух.

Також існує модель, в якій передбачається, що локалізація звуку може бути змодельована на основі відмінностей швидкості реакції певних популяцій нейронів з різних півкуль мозку, тобто. модель міжпівкульної асиметрії ().

Досі було складно однозначно заявити, яка з двох теорій (моделей) правильна, враховуючи, що кожна з них передбачає різні залежності локалізації звуку від інтенсивності звуку.

У цьому дослідженні вчені вирішили об'єднати обидві моделі, щоб зрозуміти, чи засноване сприйняття звуків на нейронному кодуванні або на різниці реакції окремо взятих нейронних популяцій. Було проведено кілька експериментів, у яких брали участь люди віком від 18 до 27 років (5 жінок та 7 чоловіків). Аудіометрія (вимір гостроти слуху) учасників становила 25 дБ або вище при частоті від 250 до 8000 Гц. Учасника дослідів розміщували у звукоізольованій кімнаті, в якій було розміщено спеціальне обладнання, відкаліброване з високою точністю. Учасники мали, почувши звуковий сигнал, вказати напрям, звідки він виходить.

Результати дослідження

Для оцінки залежності латералізації* Мозковий активності від інтенсивності звуку у відповідь на марковані нейрони були використані дані про швидкість реакції нейронів у ламінарному ядрі мозку сипухи.

Латеральність* - асиметрія лівої та правої половин тіла.

Для оцінки залежності латералізації мозкової активності від швидкості реакції певних популяцій нейронів були використані дані активності нижнього двоолмію мозку макаки-резуса, після чого додатково були розраховані відмінності швидкості нейронів з різних півкуль.

Модель маркованої лінії нейронів-детекторів передбачає, що при зменшенні інтенсивності звуку латеральність джерела, що сприймається, буде сходитися в середніх значеннях, схожих для відношення тихих і гучних звуків ().

Модель міжпівкульної асиметрії, у свою чергу, передбачає, що при зниженні інтенсивності звуку до майже порогових латеральність, що сприймається, буде зміщуватися до середньої лінії (1D).

За більш високої загальної інтенсивності звуку передбачається, що латералізація буде інваріантною за інтенсивністю (вставки на и 1D).

Отже, аналіз того, як інтенсивність звуку впливає на сприйманий напрямок звуку, дозволяє точно визначити природу процесів, що протікають в цей момент — нейрони з однієї загальної області або нейрони з різних півкуль.

Очевидно, що здатність людини розрізняти ITD може змінюватись в залежності від інтенсивності звуку. Проте вчені заявляють, що досить складно інтерпретувати попередні висновки, що пов'язують чутливість до ITD та оцінку слухачем спрямування джерела звуку як функції інтенсивності звуку. Одні дослідження кажуть, що при досягненні інтенсивності звуку до граничного порога, знижується латеральність джерела, що сприймається. Інші дослідження говорять про те, що впливу інтенсивності на сприйняття немає взагалі.

Іншими словами, вчені «м'яко» натякають, що в літературі досить мало інформації щодо зв'язку ITD, інтенсивності звуку та визначення напряму його джерела. Є теорії, які є як свого роду аксіоми, загальноприйняті науковою спільнотою. Тому було вирішено детально перевірити всі теорії, моделі та можливі механізми сприйняття слуху на практиці.

Перший експеримент був поставлений на основі використання психофізичної парадигми, що дозволило вивчити латералізацію на основі ITD як функцію інтенсивності звуку в групі з десяти учасників досвіду, що нормально чують.

Локалізація звуків: як мозок розпізнає джерела звуків
Зображення №2

Джерела звуку були спеціально налаштовані те щоб охоплювати більшість частотного діапазону, у якого люди здатні розпізнавати ITD, тобто. від 300 до 1200 Гц ().

У кожному з випробувань слухач мав вказати передбачувану латеральність, що вимірюється як функцію рівня відчуттів, у діапазоні значень ITD від 375 до 375 мс. Щоб визначити вплив інтенсивності звуку, використовувалася нелінійна модель змішаного ефекту (NMLE), яка включала фіксовану, так і випадкову інтенсивність звуку.

Графік демонструє оцінену латералізацію зі спектрально плоским шумом за двох інтенсивностей звуку для репрезентативного слухача. А графік показує необроблені дані (кола) та підігнані під модель NMLE (лінії) всіх слухачів.

Локалізація звуків: як мозок розпізнає джерела звуків
Таблиця №1

Таблиця вище відображає всі параметри NLME. Видно, що латеральність, що сприймається, зростала при збільшенні ITD, як того і очікували вчені. Зі зменшенням інтенсивності звуку сприйняття все більше зміщувалося у бік середньої лінії (вставка на графіку 2C).

Ці тенденції були підкріплені моделлю NLME, яка показала суттєвий вплив ITD та інтенсивності звуку на максимальний ступінь латеральності, підтверджуючи модель міжпівкульових відмінностей.

Крім того, незначний вплив на латеральність, що сприймається, мали середні аудіометричні пороги чистих тонів. А ось інтенсивність звуку суттєво не впливала на показники психометричних функцій.

Основною метою другого експерименту було визначення того, як отримані в попередньому експерименті результати зміняться з урахуванням спектральних особливостей стимулів (звуків). Необхідність перевірки спектрально плоского шуму при низькій інтенсивності звуку у тому, частини спектру може бути не чути, і це може вплинути визначення напрями звуку. Отже, за результати першого експерименту можна помилково прийняти факт, що ширина чутної частини спектра може зменшуватися зі зменшенням інтенсивності звуку.

Тому було вирішено провести ще один досвід, але вже із застосуванням назад А-зважених* шумів.

А-зважування* застосовується до рівнів звуку, щоб врахувати відносну гучність, що сприймається людським вухом, оскільки вухо менш чутливе до низьких звукових частот. А-зважування реалізується шляхом арифметичного додавання таблиці значень, перерахованих у октавних смугах, до виміряних рівнів звукового тиску дБ.

На графіку 2D показані необроблені дані (кола) та підігнані під модель NMLE дані (лінії) всіх учасників експерименту.

Аналіз даних показав, що коли всі частини звуку є приблизно однаково чутними (як у першому, так і в другому досвіді), латеральність, що сприймається, і нахил на графіку, що пояснює зміна латеральності з ITD, зменшуються з падінням інтенсивності звуку.

Отже, результати другого експерименту підтвердили результати першого. Тобто на практиці було показано, що модель, запропонована ще в 1948 Джеффрессом, не є правильною.

Виходить, що локалізація звуків погіршується при зниженні інтенсивності звуку, а Джеффрес вважав, що звуки сприймаються і обробляються людиною однаково незалежно від їхньої інтенсивності.

Для більш детального ознайомлення з нюансами дослідження рекомендую заглянути у доповідь вчених.

Епілог

Теоретичні припущення і практичні досліди, що підтверджують їх, показали, що нейрони головного мозку у ссавців активуються з різною швидкістю в залежності від напрямку звукового сигналу. Відтак мозок порівнює ці швидкості між усіма задіяними в процесі нейронами для динамічної побудови карти звукового середовища.

Модель Джеффрессона насправді не на 100% хибна, тому що за її допомогою можна ідеально описати локалізацію джерела звуку у сівух. Так, для сипух інтенсивність звуку не має значення, вони у будь-якому випадку визначать положення його джерела. Однак ця модель не працює з макаками-резусами, як показали раніше проведені досліди. Отже, ця модель Джеффрессона неспроможна описати локалізацію звуків всім живих істот.

Експерименти за участю людей вкотре підтвердили, що локалізація звуків протікає у різних організмів по-різному. Багато учасників не змогли правильно визначити положення джерела звукових сигналів через низьку інтенсивність звуків.

Вчені вважають, що їхня праця показує певну схожість тим часом, як ми бачимо і як ми чуємо. Обидва процеси пов'язані зі швидкістю нейронів у різних ділянках мозку, а також з оцінкою цієї різниці для визначення положення видимих ​​нами предметів у просторі, так і положення джерела чутного нами звуку.

Надалі дослідники збираються провести низку експериментів для детальнішого розгляду зв'язку між слухом і зором людини, що дозволить краще зрозуміти, як саме наш мозок динамічно будує карту навколишнього світу.

Дякую за увагу, залишайтеся цікавими та хорошим всім робочого тижня, хлопці! 🙂

Дякую, що залишаєтеся з нами. Вам подобаються наші статті? Бажаєте бачити більше цікавих матеріалів? Підтримайте нас, оформивши замовлення або порекомендувавши знайомим, хмарні VPS для розробників від $4.99, 30% знижка для користувачів Хабра на унікальний аналог entry-level серверів, який був винайдений нами для Вас: Вся правда про VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps від $20 чи як правильно ділити сервер? (Доступні варіанти з RAID1 і RAID10, до 24 ядер і до 40GB DDR4).

Dell R730xd у 2 рази дешевше? Тільки в нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТБ від $199 у Нідерландах! Dell R420 – 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB – від $99! Читайте про те Як побудувати інфраструктуру корп. класу із застосуванням серверів Dell R730xd Е5-2650 v4 вартістю 9000 євро за копійки?

Джерело: habr.com

Додати коментар або відгук