专利类型:发明专利
语 言:中文
申 请 号:CN201510268390.5
申 请 日:20150525
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙坪坝正街174号
公 开 日:20150909
公 开 号:CN104900235A
代 理 人:陈千
代理机构:重庆为信知识产权代理事务所(普通合伙) 50216
摘 要:本发明提供了一种基于基音周期混合特征参数的声纹识别方法,包括以下步骤:语音信号的采集输入、语音信号预处理、语音信号组合特征参数提取:即提取基音周期、LPCC、ΔLPCC、能量、能量的一阶差分、GFCC特征参数共同组合成多维特征向量、采用离散二进制粒子群优化算法对多维特征参数进行筛选、引入通用背景模型UBM训练得到说话人的声音模型、最后利用GMM-UBM模型对测试语音进行识别。与单一的语音信号特征参数进行声纹识别相比,采用组合特征参数并使用GMM-UBM模型的声纹识别系统,有效地提高了声纹识别的识别准确率和系统稳定性。
主 权 项:一种基于基音周期混合特征参数的声纹识别方法,其特征在于,包括如下步骤:S1:语音信号的采集输入;S2:语音信号的预处理,主要包括预加重、分帧和加窗处理;S3:语音信号组合特征参数提取:提取基音周期、LPCC、ΔLPCC、能量、能量的一阶差分以及GFCC特征参数共同组合成多维特征向量,其中:LPCC为线性预测倒谱系数,△LPCC为LPCC的一阶差分,GFCC为Gammatone滤波器倒谱系数;S4:利用离散二进制粒子群优化算法对步骤S3中的多维特征向量进行筛选,将GMM?UBM识别过程中等错误率作为评价函数,选取使得等错误率最小的特征向量作为声纹识别的特征向量,其中所述GMM?UBM为高斯混合模型与通用背景模型相结合的说话人识别模型;S5:使用GMM?UBM训练得到说话人的声音模型,即将语音库随机选取相应数量的语音训练得到通用背景模型UBM,然后利用最大后验准则自适应得到不同说话人的声音模型;S6:提取经粒子群优化算法筛选后的测试语音的特征参数,利用步骤S5训练得到的GMM?UBM模型,计算出对数概率得分,选择概率得分最大者,即为目标说话人。
关 键 词:
法律状态:公开
IPC专利分类号:G10L17/02(2013.01)I;G10L17/04(2013.01)I