首页/文章/ 详情

乐音感知系列(四)部位学说的局限性

2年前浏览1696

各位看官好,书接上回,我们本期讲一讲“部位学说”的局限性。

640.gif


部位学说为解释听觉系统从一组频率中分析出基频成分提供了理论依据,然而,它还存在一系列问题,因为它不能解释以下几点:


(1)  人类感知音高的精度是极高的;

(2)  不是所有的频率成分都能被部位学说决定的音高感知机理分辨出来;

(3)  具有连续(非谐波)频谱的声音的音高感知;

(4)  基频低于50Hz声音的音高感知。

640 (1).gif


在心理声学中,辨别除了一个参量不同(如基频、强度、持续时间等)其他参量均相同的两个非常相似的声音的能力,可以用“差别阈限”(difference limen,缩写DL)或“最小听觉差”(just noticeable difference,缩写JND)来表示。我们在声音与听觉系列知识里就介绍过JND,所以我们还是沿用JND。

image.png

上图是人类音高感知的最小可觉差曲线,图中同时标注了临界频带曲线。JND是Zwicker等人实验得出的,在实验中使用正弦波(稳态信号)作为激励信号,并且使声音强度和声音的持续时间保持不变。实验结果表明,JND在人耳听觉范围内接近临界频带的1/30。这比较接近于半音程的1/12。因此,音高的JND比听觉滤波器的带宽(临界频带)小得多。

640 (1).gif

这里要插入一条知识点——临界带宽。

假设两个纯音信号,振幅分别为A1和A2,频率分别为F1和F2。如果保持F1频率不变,F2从F1开始慢慢向高或向低变化,听觉上会出现以下变化结果。

image.png

当频率差小于12.5Hz时,大多数听音者会感觉到拍音现象,拍的频率为F2-F1的绝对值,幅值为A2-A1的绝对值;当频率差大于15Hz时,听感逐渐从拍音变成一个音高不明确的不稳定的声音;当频率差继续增大到某一值时,两个频率从混合在一起变为可被人耳分离了,但是仍有不平稳的听感;当频率差进一步增大时,听感将从不平稳转变为平稳,此时的频率差对应的带宽称为临界频带,图中用CB标记。

临界频带的正式定义为:主观听感突然发生明确变化的频带宽度。

为了使临界频带的概念更实用,学者提出了等效矩形带宽(英文缩写为ERB)的概念,并提出了计算公式如下:

image.png

这个公式适用的频率范围是100Hz到10000Hz。其中中心频率Fc的单位为kHz。

640 (1).gif


假如相关的听觉滤波器的临界频带足够窄,可以把相邻的谐波成分排除在外,那么听觉的部位机理可以分解出该谐波成分。

基底膜的频谱分析功能相当于一个滤波器组,当临界带宽超过相邻谐波的间距时,就不能通过部位分析机理来分辨谐波。

事实证明,不管声音的基频是多少,它的前5~7次谐波一般都能通过部位分析机理分辨出来。这一点可以通过下面的例子进行说明。

假设一组谐波的基频是110Hz,其前10个谐波频率为110、220、330、440、550、660、770、880、990、1100Hz。若临界带宽超过110Hz,基底膜就无法继续分辨出谐波了。

根据前述ERB的计算公式,可以计算出当临界带宽等于110Hz时的中心频率为790Hz。因为临界带宽随着中心频率的增大而增大,所有中心频率大于790Hz的滤波器的带宽都将大于110Hz。根据下表,790Hz小于第7次和第8次谐波之间的中间频率825Hz,因此,第7次谐波和第8次谐波之间的听觉滤波器的带宽大于110Hz,因此,这两个相邻的谐波不能被分辨。

image.png

所以,听觉可以分辨基频为110Hz的第6次以及第6次以下的谐波,但不能分辨第7次以及第7次以上的谐波。

观察第一节的ERB曲线,我们可以得出一个一般性规律,即不论基频是多少,听觉不能分辨高于约第5次到第7次的谐波。这个规律对理解音高感知以及心理声学其他方面的问题是至关重要的。

640 (1).gif

一些具有非谐波频谱的声音也可以有音高感。例如,英文单词sea中的“ss”和shell中的“sh”,大家尝试发音,可立马判断出来ss的音高高于sh。把二者的发音录制下来,观察他们的频谱,如下图。

图片

可以看出ss的峰值出现在5kHz附近,而sh的峰值出现在2.5kHz附近。

对于这种非谐波频谱的声音,听觉判断音调高低的依据就是它们的频谱能量的“重心”的高低。

但是,听觉对非周期变化的声音的音高感知能力比周期性变化的声音差很多。这种音高感知现象对理解音乐中非周期性声音的音高感知非常重要。然而,绝大部分乐器产生的声压波形还是周期性变化的。

图片

最后,部位学说无法解释只包含50Hz以下频率成分的声音的音高感知。因为在这个频率范围,基底膜的振动模式不随频率的改变而改变。这类声音非常少有,但是可以用电子合成器产生。

由于人类最低可听频率为20Hz,一个基频为20Hz的声音的谐波可以是40Hz、60Hz等,只有前两个谐波在基底膜上的响应不发生变化,高于50Hz的谐波则可以用一般的部位学说机理分析出来。

人类能够对20~50Hz的正弦波产生不同的音高感,但是部位机理不能解释这个现象。

640.gif


以上就是一些部位学说不能解释的主要问题。本期就介绍到这里了。


持续关注ACOUTEC,下一期我们将讨论音高感知的时间论,它可以帮助部位学说解释一部分问题。


理论科普声学其他软件
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2022-06-15
最近编辑:2年前
埃库特整车声品质
整车声品质控制技术与量产提供商...
获赞 37粉丝 34文章 33课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈