专利类型:发明专利
语 言:中文
申 请 号:CN201810373614.2
申 请 日:20180424
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20181009
公 开 号:CN201810373614.2
代 理 人:王翔
代理机构:重庆缙云专利代理事务所(特殊普通合伙) 50237
摘 要:本发明公开一种基于运动边界稠密采样和运动梯度直方图的人体动作识别方法,主要包括以下步骤:1)输入视频流。2)计算输入视频的光流场并进行特征点采样,提取稠密特征点。3)计算特征点的轨迹。4)沿该特征点轨迹计算稠密描述符。5)对相邻两帧视频图像在时间上求导得到时序上的运动图像,再计算运动图像的空间梯度,得到运动梯度描述符HMG。6)对各个描述符分别进行特征编码。7)对各个描述符作正则化处理后,将稠密描述符与运动梯度描述符以串联形式相连接形成特征向量。8)对特征向量进行训练和学习得到人体动作识别模型。9)利用所述人体动作识别模型对人体动作进行识别。本发明在提高动作识别精度的同时缩减了计算开销。
主 权 项:1.一种基于运动边界稠密采样和运动梯度直方图的人体动作识别方法,其特征在于,主要包括以下步骤:1)输入所述视频流;2)计算输入视频的光流场并进行特征点采样,提取稠密特征点;3)依据设定的视频帧数,计算特征点的轨迹;4)沿所述特征点轨迹计算稠密描述符HOG、稠密描述符HOF、稠密描述符MBH和稠密描述符Traj;稠密描述符MBH包括MBHx和MBHy两个分量。稠密描述符HOG主要描述静态外观信息;稠密描述符HOF描述局部运动信息;稠密描述符MBHx描述光流梯度在x方向上的移动信息;稠密描述符MBHy描述光流梯度在y方向上的移动信息;稠密描述符Traj主要描述轨迹的长度和位移信息;6)对相邻两帧视频图像在时间上求导,得到时序上的运动图像;计算所述时序上的运动图像的空间梯度,从而得到运动梯度描述符HMG;6)利用FV编码分别对稠密描述符HOG、稠密描述符HOF、稠密描述符MBHx、稠密描述符MBHy、稠密描述符Traj和运动梯度描述符HMG进行特征编码;7)分别对稠密描述符HOG、稠密描述符HOF、稠密描述符MBHx、稠密描述符MBHy、稠密描述符Traj和运动梯度描述符HMG作正则化处理;正则化处理后,将稠密描述符和运动梯度描述符以串联形式相连接形成特征向量;8)利用线性支持向量机对特征融合得到的特征向量进行训练和学习,得到人体动作识别模型;9)利用所述人体动作识别模型对人体动作进行识别。
关 键 词:
法律状态:公开
IPC专利分类号:G06K9/00;G06K9/62;G06K9/00;G06T7/246;G06T7/00;G06T7/269;G06T7/00;G06T7/277;G06T7/00;G;G06;G06K;G06T;G06K9;G06T7;G06K9/00;G06K9/62;G06K9/00;G06T7/246;G06T7/00;G06T7/269;G06T7/00;G06T7/277;G06T7/00