浏览量:0

一种基于听觉感知特性的语音质量客观评价方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201210332288.3 

申 请 日:20120911 

发 明 人:谭晓衡秦基伟周帅裴婧黄振林唐永刚马旭东 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙坪坝正街174号重庆大学通信工程学院 

公 开 日:20140402 

公 开 号:CN102881289B 

代 理 人: 

代理机构: 

摘  要:本发明公开了一种简单有效的基于听觉感知特性的语音质量客观评价方法,根据心理声学原理将人耳听觉模型和非线性压缩变换引入MFCC(Mel频率倒谱系数)特征参数的提取过程。本发明使用Gammatone滤波器组对耳蜗基底膜进行仿真,在幅值非线性变换过程中用立方根非线性压缩变换来模拟语音的强度-响度感知特性。使用新的特征参数,提出了一种更加符合人耳听觉感知特性的语音质量评价方法。与其它方法相比,本发明有效地提高了客观评价结果与主观评价结果的相关度,运行时间较短且复杂度低,具有较强的适应性,可靠性和实用性。本发明通过模拟人耳的听觉感知特性来进行语音质量评价的方法可为改善语音质量客观评价提供新的解决思路。 

主 权 项:一种简单有效的基于听觉感知特性的语音质量客观评价技术,根据心理声学原理将人耳听觉模型和非线性压缩变换引入特征参数的提取过程来进行语音质量的客观评价,其特征在于采用以下步骤:A、将原始语音和通过被测系统的失真语音进行预处理,以便于提取各自的特征参数;B、对经过预处理的语音信号进行加汉宁窗的FFT变换,得到第K帧信号频谱????????????????????????????????????????????????;C、采用MEL频率尺度来模拟人耳对声音频率的感知特性,MEL频率与实际频率的具体关系为:;D、通过一组MEL尺度的GAMMATONE滤波器组,在频域对能量谱进行滤波,得到每个GAMMATONE滤波器的输出能量,计算过程由式给出:;E、采用立方根变换来模拟强度?响度的非线性压缩关系:;F、用RASTA滤波器对语音信号进行滤波,抑制信号频谱中的常量或变化缓慢的非语音部分,增强动态成分,RASTA滤波器的表达式为:;G、立方根能量经过RASTA滤波和DCT变换到倒谱域,即可得到新的特征参数,计算过程由式给出:;H、计算两路信号特征参数的平均动态MEL倒谱距离D,将D值进行二次多项式变换来预测主观MOS分,通过预测值的大小来判断被测系统语音质量的好坏。119204DEST_PATH_IMAGE001.JPG,2012103322883100001DEST_PATH_IMAGE002.JPG,384969DEST_PATH_IMAGE003.JPG,2012103322883100001DEST_PATH_IMAGE004.JPG,820630DEST_PATH_IMAGE005.JPG,2012103322883100001DEST_PATH_IMAGE006.JPG,716910DEST_PATH_IMAGE007.JPG 

关 键 词: 

法律状态:生效 

IPC专利分类号:G10L25/60