专利类型:发明专利
语 言:中文
申 请 号:CN201210314067.3
申 请 日:20120830
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20140430
公 开 号:CN102800316B
代 理 人:郭云
代理机构:重庆市前沿专利事务所(普通合伙) 50211
摘 要:本发明涉及一种基于神经网络的声纹识别系统的最优码本设计方法,包括语音信号输入、语音信号预处理、语音信号特征参数提取、三路初始码本生成、神经网络训练以及最优码本选择五个步骤,在预处理后同时了提取MFCC和LPCC参数,然后采用局部最优的矢量量化法和全局最优的遗传算法,实现了基于VQ、GA、VQ与GA的三路并列算法对混合语音特征参数矩阵产生初始码本,通过对三路码本的神经网络识别准确率的判决,选出最优码本。其显著效果是:利用该最优码本,使得声纹识别系统获得较高的识别率和稳定性,并提高了系统的自适应性;较之单一的码本进行模式识别,采用基于神经网络得到的最优码本的声纹识别系统,其性能有明显的改进。
主 权 项:一种基于神经网络的声纹识别系统的最优码本设计方法,包括:S1:用于语音信号输入的步骤;S2:对输入的语音信号段进行预处理的步骤;S3:对预处理后的语音信号段提取特征参数的步骤;其特征在于,还包括:S4:用于生成三个初始码本的步骤,该步骤中第一初始码本采用矢量量化法生成,第二初始码本采用遗传算法生成,第三初始码本先采用矢量量化法,再采用遗传算法生成;S5:用于神经网络训练的步骤,该步骤中利用神经网络分别对三个初始码本进行训练,得到第一初始码本识别正确率、第二初始码本识别正确率以及第三初始码本识别正确率;S6:用于选择最优码本的步骤,该步骤中选择三个初始码本中识别正确率最高的一个初始码本作为输入的语音信号段的最优码本。
关 键 词:
法律状态:生效
IPC专利分类号:G10L17/02; G10L17/18