浏览量:0

基于八邻域特征的数字识别方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201611090923.6 

申 请 日:20161201 

发 明 人:卓颋朱征宇殷荣华马乔刘洪明 

申 请 人:重庆大学北京软云神州科技有限公司 

申请人地址:400030 重庆市沙坪坝区正街174号 

公 开 日:20180130 

公 开 号:CN106503694B 

代 理 人:吴彬 

代理机构:重庆信航知识产权代理有限公司 50218 

摘  要:本发明公开了一种基于八邻域特征的数字识别方法,包括步骤:1)获取手写体数字的原图;2)对原图进行预处理;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活频率;5)特征向量的提取;6)特征向量的优化;7)相似性度量。本发明基于八邻域特征提取,只提取了图像数字的有用信息,减少了输入模型的数据量,从而提高了算法的执行速度;字符距离特征用相对距离表示,从而消除了字符大小对识别结果的影响,达到了优化特征值的目的,提高了特征值对字符的表征程度;字符识别算法采用的是欧几里得度量,算法简单且结果明显;本发明能实现对手写体数字的高效和高准确率识别。 

主 权 项:基于八邻域特征的数字识别方法,其特征在于:包括以下步骤:1)获取手写体数字的原图;2)对原图进行预处理第一步,将彩色原图进行灰度化;第二步,将灰度化后的图像再进行二值化;第三步,对二值化图像进行去噪声处理,得到预处理后的图像;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活频率;所述八邻域方向:即某一像素点周围八个相邻的像素点构成了它的八邻域,八邻域与该像素点的相对位置构成了该像素点的八邻域方向;某一像素点的八邻域方向包括:0度、45度、90度、135度、180度、225度、270度、315度;激活点:在二值化图像中,如果一个像素点的值为1,而且其八邻域中有一个值为0的像素点,则称该点为激活点,表示该点包含了八邻域特征;所述激活频次:激活点的某一邻域上的值为0,表明该点在这一邻域方向被激活一次;某一邻域方向的激活频次即为所有激活点在此邻域方向被激活的总次数,0度方向、45度方向、90度方向、135度方向、180度方向、225度方向、270度方向、315度方向的激活频次依次记为f1,f2,f3,f4,f5,f6,f7,f8;激活频率:某一邻域方向的激活频率即为此邻域的激活频次在激活总频次的占比,记为:Pi=fiΣj=18fj其中,i为第i个方向,i={1,2,3,…8};5)将二值化图像分为五个象限,计算每一个象限激活点占比I=[i(1),i(2),i(3),i(4),i(5)];第一到第四象限激活点重心角度A=[a(1),a(2),a(3),a(4),a(5)];激活点重心到中心点的距离D=[d(1),d(2),d(3),d(4),d(5)];从而得到分割出的字符特征向量W=(P,I,A,D);6)特征向量的提取第一步,通过公式Xj=1nΣi=1nxiYj=1nΣi=1nyi提取每个象限的重心点坐标,n为第i个象限重心点的激活点个数,xi为激活点的横坐标,yi为激活点的纵坐标;Xj为第j个象限重心点横坐标,Yj为第j个象限重心点纵坐标;第二步,根据公式α(i)=i-12π+(-1)i-1×sin-1(|P(i,1)-centerpx|/r)计算激活点重心角度,P(i,1)为第i个象限的重心点纵坐标,centerpx为图像中心点纵坐标;第三步,根据公式r=d(i)=(xi-X)2+(yi-Y)2计算第i个象限重心点到图像中心点的距离;图像中心点的横坐标为X=w/2,纵坐标为Y=h/2;h、w分别为图像的高和宽;7)特征向量的优化第一步,细化操作a)对数字图形进行预腐蚀,将所有腐蚀可去除的像素点标明,但不立即去除;b)以第一步标注的可去除像素点为基础,选择消除那些消除后不会破坏字符连通性的点,并保留其他点,以确保字符图像的拓扑结构;第二步,调整特征值a)激活点占比I=[i(1),i(2),i(3),i(4),i(5)]以百分制表示,增加激活点占比的量级;b)调整距离特征值D=[d(1),d(2),d(3),d(4),d(5)],通过公式d(i)=(xi-XX)2+(yi-YY)2计算激活点重心到二值化图像中心点的距离,xi为第i个象限的重心点的横坐标,yi为第i个象限的重心点的纵坐标,X为图像中心点的横坐标,同时也为图像宽的1/2,Y为图像中心点的纵坐标,同时也为图像高的1/2;8)相似性度量第一步,选取0,1,2,3,4,5,6,7,8,9这十个书写标准的手写体数字,用前述步骤4)至6)所述的方法分别提取各数字的特征向量W=(P,I,A,D),并将这10个数字的特征向量存为数字的标准特征,作为待识别字符特征向量比较的标准;第二步,采用欧几里得度量计算标准数字特征与待识别字符特征的相似性,通过比较相似性的大小判断待识别字符。 

关 键 词:八邻域特征;频次;算法;优化;预处理;数字识别方法;手写体数字;特征向量;特征值;度量;提高;图像;公开;执行;影响;准确率;分割;提取;激活;实现; 

法律状态: 

IPC专利分类号:G06K9/00(2006.01)I,G06K9/38(2006.01)I,G06K9/40(2006.01)I,G06K9/60(2006.01)I