声音定位:大脑如何识别声源

声音定位:大脑如何识别声源

我们周围的世界充满了我们大脑不断处理的各种信息。 他通过感觉器官接收这些信息,每个感觉器官负责其信号份额:眼睛(视觉)、舌头(味觉)、鼻子(嗅觉)、皮肤(触觉)、前庭器官(平衡、空间位置和感觉)。重量)和耳朵(声音)。 通过结合来自所有这些器官的信号,我们的大脑可以准确地了解我们的环境。 但我们并不了解处理外部信号的所有方面。 这些秘密之一是定位声音来源的机制。

言语和听力神经工程实验室(新泽西理工学院)的科学家提出了一种声音定位神经过程的新模型。 在感知声音过程中大脑中发生了哪些具体过程,我们的大脑如何理解声源的位置,以及这项研究如何帮助对抗听力缺陷。 我们从课题组的报告中了解到这一点。 去。

研究基础

我们的大脑从感官接收到的信息在来源和处理方面都各不相同。 有些信号立即在我们的大脑中显示为准确的信息,而另一些则需要额外的计算过程。 粗略地说,我们会立即感受到触摸,但当我们听到声音时,我们仍然必须找到它来自哪里。

在水平面上定位声音的基础是 耳间* 时差(ITD 从 耳间时间差)声音到达听者的耳朵。

耳间底座* - 耳朵之间的距离。

大脑中有一个特定区域(内侧上橄榄或 MSO)负责此过程。 当MVO接收到声音信号的那一刻,耳间时间差就转化为神经元的反应速率。 作为 ITD 函数的 MBO 输出速度曲线的形状类似于每只耳朵的输入信号的互相关函数的形状。

MBO 中的信息是如何处理和解释的仍然不完全清楚,这就是为什么存在一些非常矛盾的理论。 最著名且事实上经典的声音定位理论是 Jeffress 模型(劳埃德·杰弗里斯)。 它是基于 标记线* 对来自每只耳朵的神经输入的双耳同步敏感的检测器神经元,每个神经元对一定量的 ITD 最为敏感().

划线原则* 这是一个假设,解释了不同的神经如何产生不同的感觉,所有这些神经都使用相同的生理原理沿着轴突传递脉冲。 如果结构相似的神经连接到中枢神经系统中能够以不同方式解码相似神经信号的独特神经元,它们就会产生不同的感觉。

声音定位:大脑如何识别声源
图片#1

该模型在计算上类似于神经编码,基于到达双耳的声音的无约束互相关性。

还有一个模型表明,声音定位可以根据来自大脑不同半球的某些神经元群的响应速度的差异来建模,即半球间不对称模型(1V).

到目前为止,很难明确地说明这两种理论(模型)中哪一种是正确的,因为它们各自预测了声音定位对声音强度的不同依赖性。

在我们今天看到的研究中,研究人员决定将这两种模型结合起来,以了解声音的感知是基于神经编码还是基于个体神经群体反应的差异。 进行了几项实验,其中 18 至 27 岁的人(5 名女性和 7 名男性)参与其中。 参与者的听力测试(听力敏锐度的测量)在 25 至 250 Hz 之间为 8000 dB 或更高。 实验参与者被安置在一个隔音房间里,里面放置了经过高精度校准的特殊设备。 参与者必须在听到声音信号后指出声音来自的方向。

研究结果

评估依赖性 偏侧化* 根据对标记神经元的声音强度的大脑活动,使用了仓鸮大脑层状核神经元反应速度的数据。

偏侧性* - 身体左右半部不对称。

为了评估大脑活动偏侧化对某些神经元群体反应速度的依赖性,使用了恒河猴大脑下丘活动的数据,然后另外计算了不同半球神经元速度的差异。

检测器神经元的标记线模型预测,随着声音强度的降低,感知源的偏侧性将收敛到类似于轻声与响声之比的平均值(1S).

反过来,半球不对称模型表明,当声音强度降低到接近阈值水平时,感知的偏侧性将向中线移动(1D).

在较高的总体声音强度下,偏侧化预计将是强度不变的(插图中的插图) 1S и 1D).

因此,分析声音强度如何影响声音的感知方向,使我们能够准确确定当时发生的过程的性质 - 来自同一区域的神经元或来自不同半球的神经元。

显然,一个人辨别 ITD 的能力可能会根据声音强度而变化。 然而,科学家们表示,很难解释之前将灵敏度与 ITD 以及听众对声源方向的判断与声音强度联系起来的发现。 一些研究表明,当声音强度达到边界阈值时,声源的感知侧向性会降低。 其他研究表明强度对感知根本没有影响。

换句话说,科学家们“温和地”暗示,文献中关于 ITD、声音强度和确定声源方向之间关系的信息很少。 有些理论作为一种公理而存在,被科学界普遍接受。 因此,决定在实践中详细测试听觉感知的所有理论、模型和可能的机制。

第一个实验基于心理物理学范式,允许在 XNUMX 名正常听力参与者中研究基于 ITD 的偏侧化作为声音强度的函数。

声音定位:大脑如何识别声源
图片#2

声源经过专门调整,覆盖了人类能够识别 ITD 的大部分频率范围,即从 300 到 1200 赫兹().

在每次试验中,听者必须在 375 至 375 毫秒的 ITD 值范围内表明感知的偏侧性,作为感觉水平的函数进行测量。 为了确定声音强度的影响,使用了非线性混合效应模型(NMLE),其中包括固定和随机声音强度。

时间表 2V 演示了代表性听众在两种声音强度下的频谱平坦噪声的估计偏侧化。 以及时间表 2S 显示所有听众的原始数据(圆圈)和拟合的 NMLE 模型(线)。

声音定位:大脑如何识别声源
表号1

上表显示了所有 NLME 参数。 可以看出,正如科学家所预期的那样,感知的偏侧性随着 ITD 的增加而增加。 随着声音强度的降低,感知越来越向中线移动(图中的插图) 2C).

这些趋势得到了 NLME 模型的支持,该模型显示了 ITD 和声音强度对最大程度的偏侧性的显着影响,支持了半球间差异模型。

此外,纯音的平均听力阈值对感知偏侧性影响很小。 但声音强度对心理测量功能指标没有显着影响。

第二个实验的主要目标是确定在考虑刺激(声音)的频谱特征时,上一个实验中获得的结果将如何变化。 需要在低声强下测试频谱平坦噪声,因为频谱的某些部分可能听不到,这可能会影响声音方向的确定。 因此,第一个实验的结果可能会被错误地误认为频谱的可听部分的宽度会随着声音强度的减小而减小。

因此,决定进行另一个实验,但使用相反的方法 A 计权* 噪音

A-称重* 应用于声级以考虑人耳感知的相对响度,因为耳朵对低频声音不太敏感。 A 加权是通过将倍频程列出的值表与以 dB 为单位的测量声压级进行算术相加来实现的。

在图表上 2D 显示实验中所有参与者的原始数据(圆圈)和 NMLE 模型拟合数据(线)。

数据分析表明,当声音的所有部分都大致同等可听时(在第一次和第二次试验中),感知的偏侧性和解释偏侧性随 ITD 变化的图表中的斜率随着声音强度的减小而减小。

因此,第二个实验的结果证实了第一个实验的结果。 也就是说,实践证明 Jeffress 在 1948 年提出的模型是不正确的。

事实证明,随着声音强度的降低,声音定位会恶化,杰弗里斯相信,无论强度如何,人类都会以相同的方式感知和处理声音。

为了更详细地了解这项研究的细微差别,我建议查看 科学家报告.

结语

理论假设和证实它们的实际实验表明,哺乳动物的大脑神经元根据声音信号的方向以不同的速率被激活。 然后,大脑会比较参与该过程的所有神经元之间的速度,以动态构建声音环境图。

Jeffresson 的模型实际上并不是 100% 错误,因为它可以用来完美地描述仓鸮的声源定位。 是的,对于仓鸮来说,声音的强度并不重要;无论如何,它们都会确定声音来源的位置。 然而,正如之前的实验所示,这个模型不适用于恒河猴。 因此,杰弗里森模型无法描述所有生物的声音定位。

对人类参与者的实验再次证实,声音定位在不同的生物体中发生的方式不同。 由于声音强度较低,许多参与者无法正确确定声音信号源的位置。

科学家认为,他们的工作显示了我们的视觉和听觉之间的某些相似之处。 这两个过程都与大脑不同部位神经元的速度有关,也与评估这种差异有关,以确定我们在空间中看到的物体的位置和我们听到的声音源的位置。

未来,研究人员将进行一系列实验,更详细地研究人类听觉和视觉之间的联系,这将使我们更好地了解我们的大脑到底是如何动态地构建我们周围世界的地图的。

感谢您的关注,保持好奇心,祝大家度过愉快的一周! 🙂

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的内容? 通过下订单或推荐给朋友来支持我们, 面向开发人员的云 VPS,4.99 美元起, 在我们为您发明的独特的入门级服务器模拟上,Habr 用户可享受 30% 的折扣: VPS (KVM) E5-2650 v4(6 核)10​​4GB DDR240 1GB SSD 20Gbps XNUMX 美元或如何共享服务器的全部真相? (适用于 RAID1 和 RAID10,最多 24 个内核和最多 40GB DDR4)。

戴尔R730xd便宜2倍? 只有这里 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 电视低至 199 美元 在荷兰! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 美元起! 阅读 如何建设基础设施公司同级使用价值730欧元的Dell R5xd E2650-4 v9000服务器一分钱?

来源: habr.com

添加评论