刘后广贺志恒饶柱石杨建华赵禹
1中国矿业大学机电工程学院(徐州 221116)
2上海交通大学机械系统与振动国家重点实验室(上海 200240)
响度是人耳对声音强弱的主观感知,反映了人耳对声的主观感知与声音客观物理量的关系[1]。响度感知预测是声品质客观评价的重要成分[2],随着人们对产品声品质要求的提升,建立能够准确反映人耳响度感知的预测模型具有重要意义。与此同时,响度感知预测也是助听装置验配的基础[3],如由澳大利亚国家声学实验室所提出的NAL-NL1验配算法便是基于剑桥大学Moore-Glasberg响度感知预测模型所构建[4]。故针对患者的响度感知预测,对助听装置设计及算法开发也至关重要。
为了预估人耳的响度感知,国内外很多学者提出了各种响度感知计算模型。针对正常人耳的响度感知,经典的预测模型是Zwicker模型和Moore-Glasberg模型,并分别被列为国际标准ISO 532-1[5]、ISO 532-2[6]。其 中,Moore-Glasberg模型又是对Zwicker模型的改进,特别是参考了人耳生理传递特性,对其前端的外耳、中耳滤波器重新设计,使模型更具有生理意义。但其听觉外周部分未完全基于人耳生理结构构建,中耳的传声特性与真实不同,耳蜗则是由一组通过掩蔽实验数据得出的听觉滤波器模拟。Pieper等[7]进一步将基于生理结构的耳蜗传输线模型引入响度计算,构建了生理响度预测模型。然而,该生理响度预测模型未考虑中耳的生理结构,无法用于分析中耳炎等听骨链病变对响度感知的影响,亦不能用于分析激振位置位于听小骨的人工中耳响度补偿特性。
针对上述问题,本文基于人耳生理结构,构建了包括听觉外周及模拟响度感知相关神经发放的后端模块的响度感知预测模型。通过与中耳压强增益、基底膜特性频率、耳蜗品质因子的实验测量值对比,验证了该响度模型能够较好地模拟人耳生理结构的传声特性。最终,通过响度增长曲线、等响曲线、响度临界带宽的对比,证明了所构建模型在响度感知预测上的可信度。该基于人耳生理结构的响度预测模型的构建,为中耳病变患者响度感知特性的研究,及人工中耳响度补偿算法的开发奠定了基础。
1.1 生理响度模型结构
基于人耳生理结构所构建的响度感知预测模型如图1所示,该模型主要由听觉外周模块及模拟响度感知相关神经发放的后端处理模块两部分组成。听觉外周模块又包括3部分:模拟声音从人体头部正前方传递至鼓膜传递特性的外耳道部分,模拟振动从鼓膜至镫骨足板传递特性的中耳部分,及模拟振动从镫骨至基底膜传递特性的内耳部分。其中,外耳道部分用传递函数简化模拟,处理后的声音刺激鼓膜,带动听骨链振动;
中耳部分用等效电路模型模拟,锤骨、砧锤关节、砧骨、镫砧关节、镫骨的等效阻抗分别为Zm、Zimj、Zi、Zisj、Zs,镫骨输出压力驱动内耳淋巴液流动;
内耳部分采用耳蜗传输线模型模拟,计算出由耳蜗内压差导致的基底膜响应速度V。
图1 基于人耳生理结构的响度感知预测模型Fig.1 Loudness perception model based on the physiological structure of the human ear
1.2 外耳部分模拟
采用头部相关传递函数(Head-related transfer function,HRTF),来模拟声从人体头部正前方传至鼓膜的外耳传声特性。HRTF通过N=600阶的FIR滤波器实现:
式中,PTM为施加在鼓膜上的声压;
Prefrence为参考点位声压,即头部正前方声压;
n为输入声音信号中的第n个点。考虑到响度感知多在自由声场下测试获得,选取Shaw等试验[8]所测自由场外耳传递特性曲线拟合,如图2所示。
图2 自由场人体外耳传递特性曲线Fig.2 Free-field human external ear transfer function
1.3 中耳部分模拟
响度模型(图1)中的中耳部分由中耳等效电路模型模拟计算,如图3所示。其中,鼓膜采用一维无损传输线模型模拟,具体参数列于表1[9]。其声激励下传递方程为:
式中,右侧对角矩阵为鼓膜变压器矩阵,将鼓膜声学输入参数转换为机械参数。PTM与UTM分别是鼓膜的声压与体积速度;
FU与VU分别是鼓膜输出的力与速度;
ATM是鼓膜面积;
Zchar为特征阻抗,TTM为鼓膜前向传递延时[10]。
将中耳的听骨链和关节建模为一维振动传递模型,其与内耳耦合的中耳机械阻抗的模型拓扑结构如图3所示。模型中具体参数亦列于表1。其声激励下的传递方程为:
表1 中耳等效电路模型参数值Table 1 Parameters of middle-ear circuit model
图3 中耳等效电路模型Fig.3 Middle-ear circuit model
式中,PSV与USV分别是镫骨足底板与卵圆窗结合处的压力、体积速度。传递矩阵中AME、BME、CME和DME由O’Connor等实验拟合数据获得[10]。计算传递矩阵所需的锤骨与锤骨前韧带阻抗取决于锤骨质量Mm、锤骨前韧带阻尼Rm与锤骨前韧带刚度Km;
砧锤关节阻抗取决于砧锤关节阻尼Rimj与刚度Kimj;
砧骨阻抗取决于砧骨质量Mi;
砧镫关节阻抗取决于砧镫关节阻尼Risj与刚度Kisj;
镫骨与镫骨环韧带阻抗取决于镫骨质量MS、镫骨环韧带阻尼RS与刚度KS。此外,表1中NME为锤骨与砧骨之间的听骨链杠杆比,Asf为镫骨足底板面积[11]。
与听骨链接触的内耳部分使用声阻抗模拟,如图3所示,采用团队之前报道的耳蜗输入阻抗模型与听骨链耦合[12]。
1.4 内耳部分模拟
内耳部分采用Verhulst等[13]报道的一维传输线耳蜗模型来模拟。建模过程中,假设压力在垂直于基底膜方向均匀分布[14];
将基底膜沿耳蜗纵向分为1000段,每段特征频率根据Greenwood数据确定[15]。最终,所构建的传输线系统如图4所示。其中,PSV为镫骨输入压力,Pn为施加在第n段基底膜上的压力。串联阻抗Ysn与Ypn分流通道为复变量s的函数:
图4 耳蜗传输线系统Fig.4 Cochlear transmission line system
式中,Mso与Mpo是常数。变量控制着耳蜗的瞬时非线性。当时,耳蜗为主动模型。为控制系统稳定性的反馈项。假设基底膜相邻段之间的传递函数变化局部对称,则可用代替s。引入变量,根据式(6)所示的微分方程,计算出每段基底膜上的速度v与位移y。
1.5 后端处理模块
为将听觉外周模型计算的基底膜响应该物理兴奋转变为与神经发放有关的响度,构建响度感知计算的后端处理模块。首先,将基底膜各位置在不同时刻的响应速度取绝对值,构成二维听觉信号矩阵。再按基底膜的纵向位置将其分成23个兴奋段,从而将该听觉信号矩阵分解为23个微听觉信号矩阵。其中特征频率为80-11180 Hz的所有基底膜段数按照1/3倍频程分为21个兴奋段,而特征频率大于11180 Hz以及小于80 Hz的基底膜段分别作为一个兴奋段。对每一个兴奋段产生的听觉信号矩阵用RC积分电路在时间轴上积分。采样频率(fs)与耳蜗模型的采样频率一致,为100000 Hz,时间常数τ为25 ms。选取模型输入信号的持续时间为0.2 s,该积分器对有限长时间信号与无限长时间信号积分导致的值相差不超过5%。通过该积分器对基底膜响应速度积分后得到初始生理兴奋Em,n:
Vm,n为m时刻时第n个基底膜特定位置预处理后的速度。k为与采样频率以及时间常数有关的常数:
所有的初始生理兴奋Em,n在每一个时间节点m上取均值得出均值生理兴奋一维阵列;
再对这个阵列取最大值得到第x个兴奋段产生的兴奋Ex:
N为第x个兴奋段内基底膜的段数。再采用Moore等[16]将兴奋模式转换至特定响度的方法,得到特定响度:
式中,c、ETH、G、A、α对应于不同兴奋段上的值不同,具体值采用改进粒子群优化算法计算得出。将所有特定响度相加,得出输入声音信号所产生的响度。该值为单耳响度,双耳响度近似为该单耳响度值的1.22倍[17]。
2.1 人耳传声特性模拟
2.1.1 中耳传声特性
为验证所构建的响度模型能够预测人耳生理解剖结构传声特性,首先对模型中耳部分的传声特性进行分析。通过模型计算出反映中耳传声特性的中耳压强增益,即镫骨输出压强与鼓膜输入压强之比,并将其结果与Aibara及Nakajima等实验所测值进行对比[18,19],如图5所示。从中可见,模型计算的中耳压强增益曲线在趋势上与Nakajima等人实验值[19]一致,在数值上也较接近上述实验结果。故所建响度模型可以较准确地预测实际中耳生理结构的传声特性。
图5 中耳压强增益幅频曲线对比Fig.5 Comparison of amplitude-frequency curves of middleear pressure gain
2.1.2 耳蜗传声特性
基底膜选频是耳蜗传声的主要特性,为了验证所构建模型能够准确模拟耳蜗生理结构的传声特性,分别对基底膜特征频率、及品质因子进行对比验证。首先,对模型中耳蜗纵向不同位置基底膜的特征频率进行计算,并将其结果与文献报道[15,20]进行对比,如图6所示。从中可见,模型计算的耳蜗不同位置基底膜特征频率与实验数据一致。再计算反映耳蜗基底膜频率调谐特性的品质因子QERB,并将模型计算结果与Oxenhamo等[21]及Leschke等[22]的实验测量结果进行对比,如图7所示。可见,模型计算的QERB与实验报道值也较吻合。综上可见,所构建的响度模型也能够较准确地反映耳蜗生理结构的传声特性。
图6 耳蜗基底膜选频特性验证Fig.6 Verification of frequency selectivity of cochlear basilar membrane
2.2 人耳响度感知预测
2.2.1 响度增长曲线计算
为了验证所构建响度模型能够准确预测人耳响度感知特性,先对1 kHz纯音感知的响度增长曲线进行对比,如图8所示。其中,对比曲线取自ANSI S3.4(2007)中实验数据[23]。从中可见,模型计算出的响度值与ANSI S3.4(2007)实验值一致。对于40 dB至70 dB声压级之间的声压级,输入声压级每增加10 dB,响度值大约翻倍;
曲线在低分贝时比在高分贝时更陡峭。
图8 1 kHz响度增长曲线对比验证Fig.8 Comparison of loudness growth curve at 1 kHz
2.2.2 等响曲线计算
上述响度增长曲线对比证明了所构建生理响度模型对1 kHz单频声响度感知预测的可靠性。为了验证所构建的生理响度模型在其它频率响度感知预测上的可靠性,进一步开展等响曲线对比验证,结果如图9所示。其中,对比实验曲线取自ISO 226-2003标准[24]。从图中可见,生理响度模型计算结果与ISO 226-2003的实验结果在低、中频段吻合较好。高频段预测误差略大,预测值与数据之间的最大偏差为6.26 dB,位于10 kHz的100 dB处。
图9 等响曲线对比Fig.9 Comparison of equal loudness contour
2.2.3 临界带宽计算
为了验证所构建的响度模型能准确预测非纯音的响度感知,参考Zwicker等的响度临界带宽实验[25],进行模拟计算,结果如图10所示。
图10 与可变带宽噪声匹配所需210 Hz白噪声声压级Fig.10 Level of a 210Hz wide noise required to match the loudness of a noise of variable bandwidth
计算时,输入为经过带通滤波的白噪声,中心频率为 1420 Hz,声压级分别为 30 dB、50 dB、80 dB。对比声是以中心频率为1420 Hz,带宽为210 Hz的白噪声。调整对比声的声压级,使其响度与可变带宽的测试噪声相匹配。从模型计算结果图10中可见,本响度模型计算出的响度临界带宽变化与实验数据较吻合。
3.1 正常人耳响度感知预测
自美国贝尔实验室Fletecher等[26]提出了响度概念后,为了预测人耳的响度感知特性,国内外学者建立了不同的响度预测模型。随着响度被广泛应用于噪声评估[27]、声品质分析[28]、助听装置设计[29]等工业领域,国际标准化组织已将两种经典的响度预测模型列为标准,即Zwicker模型[5]、Moore-Glasberg模型[6]。其中,Moore-Glasberg模型又是在Zwicker模型基础上的改进[16],采用外耳与中耳传递函数替换了Zwicker模型中传输因子,使得模型具有生理意义;
给出了兴奋模式的计算解析式,避免了Zwicker模型中通过查图、表来计算的繁琐过程。
虽然Moore-Glasberg模型[6]在响度计算中考虑了人耳的生理组成,但其仍是通过滤波器组近似模拟外耳、中耳、内耳的传声特性,忽略了耳内真实的生理结构。此外,为使响度预测结果逼近实验测量值,模型的中耳部分传声特性还与真实中耳不一致[16]。上述不足尽管不会影响模型在正常人耳响度感知上的预测效果,但无法用于研究人耳生理结构对响度感知的影响。针对该问题,奥登堡大学Pieper等[7]将基于生理结构的耳蜗传输线模型引入到响度计算,但仍未考虑中耳的生理结构。本文所构建的响度预测模型首次同时考虑了中耳、耳蜗的生理结构,并通过中耳压强增益、基底膜特征频率、耳蜗品质因子的对比,证明了该响度模型还能较准确模拟中耳、耳蜗的传声特性。该模型的上述优点,使得研究人耳生理结构、生理响应与响度感知间关系成为可能。
3.2 病变人耳响度感知预测
听力损伤患者的响度感知预估是助听装置适配算法开发的基础[29]。目前,听损人耳响度感知模型主要围绕感音神经性听力损伤开展,如Moore等[30]、陈章立等[31]、Pieper等[32]所构建的感音神经性听损响度感知预测模型。然而,由于上述响度感知预测模型都没有考虑中耳的生理结构,无法用于传导性及混合性听损的响度感知计算。与前述模型不同,本文所构建的响度感知模型因为考虑了中耳的生理结构,可通过调整模型中中耳组织的参数来模拟中耳畸形等传导性病变[33],能用于预测传导性及混合性听损的响度感知特性。此外,通过机械激振砧骨长突、砧骨体、镫骨等中耳组织,来补偿听力损伤的人工中耳,是近年来发展起来的新型助听装置[34]。而上述响度感知预测模型都没有考虑中耳的生理结构,故无法用于分析人工中耳激振下的响度感知特性。本响度预测模型的中耳生理结构的考虑,使得其还可用于分析人工中耳响度补偿特性。
为使响度模型能够反映人耳生理结构的传声特性,构建了基于人耳生理结构的响度感知预测模型。该响度模型主要由听觉外周模块及后端处理模块两部分组成。其中,听觉外周模块将输入声音转变为耳蜗内基底膜响应;
后端处理模块模拟听觉神经,将基底膜响应该物理响应转变为与神经发放相关的响度感知。最终,通过中耳压强增益、基底膜特征频率、耳蜗品质因子的对比,验证了模型能够较好地模拟人耳生理解剖结构的传声特性;
通过响度增长曲线、等响曲线、响度临界带宽的对比,验证了模型在响度感知预测上的可信度。该响度感知预测模型由于基于人耳生理结构,一方面有助于研究中耳畸形等生理结构病变对患者响度感知的影响;
另一方面也有利于研究人工中耳等激振位置非鼓膜的人工听觉装置的响度补偿特性。