专利类型:发明专利
语 言:中文
申 请 号:CN201110444850.7
申 请 日:20111227
申 请 人:重庆大学
申请人地址:400030 重庆市沙坪坝区沙正街174号
公 开 日:20130710
公 开 号:CN102522082B
代 理 人:康海燕
代理机构:重庆华科专利事务所 50123
摘 要:本发明是用于公共场所异常声音识别及定位方法,属于音频信号处理技术领域。该方法通过双阈值算法和Welch法估计功率谱来判定公共场所是否存在异常声音;然后将异常声音特征时序信号转换为时频域的谱图,利用听觉感知的稀疏编码声音识别技术解决异常声音的特征提取及分类识别问题。为了抑制公共场所背景噪声中脉冲噪声对异常声音定位的影响,引入非线性变换,增强异常声音的互相关函数峰值能力。对传统的HB加权函数进行改进,降低由低信噪比带来的权值变化。引入一种多帧数据加权处理,使新的HB加权广义互相关算法更加适合于处理公共场所复杂声学环境中的异常声音定位能力。由于该方法结合基于听觉感知的稀疏编码声音识别技术和改进的到达时间差的声源定位技术,可以更好的利用异常事件所伴随的声音信息,可以提高公共场所监控系统的智能化水平。
主 权 项:1.一种公共场所异常声音的识别与定位方法,所述本方法首先对公共场所获取的声音信号进行分析,确定在该区域是否存在异常声音,从而判别是否有异常事件发生;如果有异常事件发生,则快速确定异常事件发生的方向和位置,为视频监控系统提供快速、准确的方位信息;所述方法分为异常声音识别方法和异常声音定位方法两部分,其特征在于:所述异常声音识别方法为:(1)首先是判定是否存在异常声音;(2)然后将异常声音的特征时序信号转换为时频域的谱图,通过独立成分分析(ICA)、稀疏表示分类(SRC)等图像处理方法对异常声音谱图进行分类识别,具体步骤如下:①对异常声音的时序信号进行短时傅里叶变换:使用汉明窗作为滑动窗,傅里叶变换的长度为2Nf点,这样每一帧的信号都可以得到长度为Nf的频谱,其声压值为:PdB=20×log10|x(1:N
关 键 词:
法律状态:生效
IPC专利分类号:G10L15/02; G10L21/02; G10L19/02