聲音定位:大腦如何辨識聲源

聲音定位:大腦如何辨識聲源

我們周圍的世界充滿了我們大腦不斷處理的各種資訊。 他透過感官接收這些訊息,每個感官負責其訊號份額:眼睛(視覺)、舌頭(味覺)、鼻子(嗅覺)、皮膚(觸覺)、前庭器官(平衡、空間位置和感覺)。重量)和耳朵(聲音)。 透過結合所有這些器官的訊號,我們的大腦可以準確地了解我們的環境。 但我們並不了解處理外部訊號的所有面向。 這些秘密之一是定位聲音來源的機制。

語言和聽力神經工程實驗室(新澤西理工學院)的科學家提出了一種聲音定位神經過程的新模型。 在感知聲音過程中大腦中發生了哪些具體過程,我們的大腦如何理解聲源的位置,以及這項研究如何幫助對抗聽力缺陷。 我們從課題組的報告中了解到這一點。 去。

研究基礎

我們的大腦從感官接收到的訊息在來源和處理方面都各不相同。 有些訊號立即在我們的大腦中顯示為準確的訊息,而有些則需要額外的計算過程。 粗略地說,我們會立即感受到觸摸,但當我們聽到聲音時,我們仍然必須找到它來自哪裡。

在水平面上定位聲音的基礎是 耳間* 時差(ITD 從 耳間時間差)聲音到達聽者的耳朵。

耳間底座* - 耳朵之間的距離。

大腦中有一個特定區域(內側上橄欖或 MSO)負責此過程。 在MVO中接收到音頻訊號的那一刻,耳間時間差被轉換為神經元的反應速率。 作為 IT​​D 函數的 MVO 輸出速度曲線的形狀類似於每隻耳朵輸入訊號的互相關函數的形狀。

MBO 中的信息是如何處理和解釋的仍然不完全清楚,這就是為什麼存在一些非常矛盾的理論。 最著名且事實上是經典的聲音定位理論是 Jeffress 模型(勞埃德·傑弗里斯)。 它是基於 標記線* 對來自每隻耳朵的神經輸入的雙耳同步敏感的偵測器神經元,每個神經元對一定量的 ITD 最為敏感().

劃線原則* 這是一個假設,解釋了不同的神經如何產生不同的感覺,所有這些神經都使用相同的生理原理沿著軸突傳遞脈衝。 如果結構相似的神經與中樞神經系統中獨特的神經元相連,而這些神經元能夠以不同的方式解碼相似的神經訊號,那麼它們就可以產生不同的感覺。

聲音定位:大腦如何辨識聲源
圖片#1

此模型在計算上類似於神經編碼,基於到達雙耳的聲音的無約束互相關性。

還有一個模型表明,聲音定位可以根據來自大腦不同半球的某些神經元群的反應速度的差異來建模,即半球間不對稱模型(1V).

到目前為止,很難明確地說明這兩種理論(模型)中哪一種是正確的,因為它們各自預測了聲音定位對聲音強度的不同依賴性。

在我們今天看到的研究中,研究人員決定將這兩種模型結合起來,以了解聲音的感知是基於神經編碼還是基於個別神經群體反應的差異。 進行了幾項實驗,其中 18 至 27 歲的人(5 名女性和 7 名男性)參與其中。 參與者的聽力測試(聽力敏銳度的測量)在 25 至 250 Hz 之間為 8000 dB 或更高。 實驗參與者被安置在一個隔音房間裡,裡面放置了經過高精度校準的特殊設備。 參與者必須在聽到聲音訊號後指出聲音來自的方向。

研究結果

評估依賴性 偏側化* 根據對標記神經元的聲音強度的大腦活動,使用了倉鴞大腦層狀核神經元反應速度的數據。

偏側性* - 身體左右半部不對稱。

為了評估大腦活動偏側化對某些神經元群體反應速度的依賴性,使用了恒河猴大腦下丘活動的數據,然後另外計算了不同半球神經元速度的差異。

偵測器神經元的標記線模型預測,隨著聲音強度的降低,感知源的偏側性將收斂到類似輕聲與響聲之比的平均值(1S).

反過來,半球不對稱模型表明,當聲音強度降低到接近閾值水平時,感知的偏側性將向中線移動(1D).

在較高的整體聲音強度下,偏側化預計將是強度不變的(插圖中的插圖) 1S и 1D).

因此,分析聲音強度如何影響聲音的感知方向,使我們能夠準確地確定當時發生的過程的性質 - 來自同一區域的神經元或來自不同半球的神經元。

顯然,一個人辨別 ITD 的能力可能會根據聲音強度而變化。 然而,科學家表示,很難解釋先前將靈敏度與 ITD 以及聽眾對聲源方向的判斷與聲音強度聯繫起來的發現。 一些研究表明,當聲音強度達到邊界閾值時,聲源的感知側向性會降低。 其他研究顯示強度對感知根本沒有影響。

換句話說,科學家「溫和地」暗示,文獻中關於 ITD、聲音強度和確定聲源方向之間關係的資訊很少。 有些理論作為一種公理而存在,被科學界普遍接受。 因此,決定在實踐中詳細測試聽覺感知的所有理論、模型和可能的機制。

第一個實驗是基於心理物理學範式,允許在十名正常聽力參與者中研究基於 ITD 的偏側化作為聲音強度的函數。

聲音定位:大腦如何辨識聲源
圖片#2

聲源經過專門調整,涵蓋了人類能夠識別 ITD 的大部分頻率範圍,即從 300 到 1200 赫茲().

在每次試驗中,聽者必須在 375 至 375 毫秒的 ITD 值範圍內表明感知的偏側性,作為感覺水平的函數進行測量。 為了確定聲音強度的影響,使用了非線性混合效應模型(NMLE),其中包括固定和隨機聲音強度。

時間表 2V 展示了代表性聽眾在兩種聲音強度下的頻譜平坦噪音的估計偏側化。 以及時間表 2S 顯示所有聽眾的原始資料(圓圈)和擬合的 NMLE 模型(線)。

聲音定位:大腦如何辨識聲源
表1

上表顯示了所有 NLME 參數。 可以看出,正如科學家所預期的那樣,感知的偏側性隨著 ITD 的增加而增加。 隨著聲音強度的降低,感知越來越向中線移動(圖中的插圖) 2C).

這些趨勢得到了 NLME 模型的支持,該模型顯示了 ITD 和聲音強度對最大程度的偏側性的顯著影響,支持了半球間差異模型。

此外,純音的平均聽力閾值對感知偏側性影響很小。 但聲音強度對心理測量功能指標沒有顯著影響。

第二個實驗的主要目標是確定在考慮刺激(聲音)的頻譜特徵時,上一個實驗中獲得的結果將如何變化。 需要在低聲強下測試頻譜平坦噪聲,因為頻譜的某些部分可能聽不到,這可能會影響聲音方向的確定。 因此,第一個實驗的結果可能會被錯誤地誤認為頻譜的可聽部分的寬度會隨著聲音強度的減少而減少。

因此,決定進行另一個實驗,但使用相反的方法 A 計權* 噪音

A-稱重* 應用於聲級以考慮人耳感知的相對響度,因為耳朵對低頻聲音較不敏感。 A 加權是透過將倍頻程列出的值表與以 dB 為單位的測量聲壓級進行算術相加來實現的。

在圖表上 2D 顯示實驗中所有參與者的原始資料(圓圈)和 NMLE 模型擬合資料(線)。

數據分析表明,當聲音的所有部分都大致同等可聽時(在第一次和第二次試驗中),感知的偏側性和解釋偏側性隨ITD 變化的圖表中的斜率隨著聲音強度的減小而減小。

因此,第二個實驗的結果證實了第一個實驗的結果。 也就是說,實踐證明 Jeffress 在 1948 年提出的模型是不正確的。

事實證明,隨著聲音強度的降低,聲音定位會惡化,傑弗里斯相信,無論強度如何,人類都會以相同的方式感知和處理聲音。

為了更詳細地了解這項研究的細微差別,我建議看看 科學家報告.

尾聲

理論假設和證實它們的實際實驗表明,哺乳動物的大腦神經元根據聲音訊號的方向以不同的速率被激活。 然後,大腦會比較參與過程的所有神經元之間的速度,以動態建立聲音環境圖。

Jeffresson 的模型實際上並不是 100% 錯誤,因為它可以用來完美地描述倉鴞的聲源定位。 是的,對倉鴞來說,聲音的強度並不重要;無論如何,它們都會決定聲音來源的位置。 然而,如同先前的實驗所示,這個模型不適用於恒河猴。 因此,傑弗瑞森模型無法描述所有生物的聲音定位。

對人類參與者的實驗再次證實,聲音定位在不同的生物體中發生的方式不同。 由於聲音強度較低,許多參與者無法正確確定聲音訊號源的位置。

科學家認為,他們的研究顯示了我們的視覺和聽覺之間的某些相似之處。 這兩個過程都與大腦不同部位神經元的速度有關,也與評估這種差異有關,以確定我們在空間中看到的物體的位置和我們聽到的聲音來源的位置。

未來,研究人員將進行一系列實驗,更詳細地研究人類聽覺和視覺之間的聯繫,這將使我們更好地了解我們的大腦到底是如何動態地構建我們周圍世界的地圖的。

感謝您的關注,保持好奇心,祝大家度過愉快的一周! 🙂

感謝您與我們在一起。 你喜歡我們的文章嗎? 想看更多有趣的內容? 通過下訂單或推薦給朋友來支持我們, 面向開發人員的雲 VPS,4.99 美元起, 在我們為您發明的獨特的入門級服務器模擬上,Habr 用戶可享受 30% 的折扣: VPS (KVM) E5-2650 v4(6 核)10​​4GB DDR240 1GB SSD 20Gbps XNUMX 美元或如何共享服務器的全部真相? (適用於 RAID1 和 RAID10,最多 24 個內核和最多 40GB DDR4)。

戴爾R730xd便宜2倍? 只有這裡 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 電視低至 199 美元 在荷蘭! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 美元起! 閱讀 如何建設基礎設施公司同級使用價值730歐元的Dell R5xd E2650-4 v9000服務器一分錢?

來源: www.habr.com

添加評論