专利类型:发明专利
语 言:中文
申 请 号:CN201310166729.1
申 请 日:20130508
申 请 人:重庆大学
申请人地址:400030 重庆市沙坪坝区沙正街174号
公 开 日:20160525
公 开 号:CN103235825B
代 理 人:康海燕
代理机构:重庆华科专利事务所 50123
摘 要:一种基于Hadoop的海量人脸识别搜索引擎设计方法,属于云计算和模式识别领域。以Hadoop云计算框架为基础,由内层、中间层和外层三层构成。内层用于存放海量的人脸图像及身份信息与提供分布式计算资源,中间层用于搜索引擎的索引表的建立与维护,外层用于接收任务与分配任务。为了在保证精度的同时提高人脸图像在数据库中的搜索速度,本方法采用在中间层使用K均值聚类算法建立人脸特征向量聚类索引表与聚类名单表相结合的方法。本方法可以使用廉价的普通服务器组构建海量人脸识别搜索引擎,并且采用经过大量实践证明的Hadoop云计算框架为基础实现,具有良好的稳定性,方法简单,易于实施。
主 权 项:一种基于Hadoop的海量人脸识别搜索引擎的人脸特征向量数据索引表的建立方法,其特征在于:所述方法以包含内层、中间层和外层的三层结构的云计算框架为基础,其中,内层由分布式的人脸身份信息数据表构成,用于存放海量的人脸图像、人脸特征向量以及对应的身份信息;中间层由人脸特征向量聚类索引表与聚类名单表构成,用于信息索引表的建立与维护;外层用于接收任务、人脸特征向量计算与任务分配;所述方法将利用人脸特征提取方法计算得到的海量人脸图像的人脸特征向量储存在非结构化的HBase数据库中,得到人脸身份信息数据表,利用K均值聚类算法对该表中人脸特征向量的每一维特征分别进行聚类分析后建立信息索引表,包括人脸特征向量聚类索引表和若干张聚类名单表;所述方法的具体步骤包括:(1)以身份信息的唯一ID为主键,以人脸图像、人脸特征向量、身份信息为“键”在内层的HBase中建立一张人脸身份信息数据表;从输入的人脸身份信息数据中提取人脸图像,使用外层分布式计算节点通过MapReduce方式计算其人脸特征向量,并将人脸特征向量及对应的人脸图像、身份信息插入到人脸身份信息数据表中,这个过程循环至所有输入的人脸身份信息数据都添加到人脸身份信息数据表中为止;(2)使用K均值聚类算法以人脸特征向量的每一维特征为分析对象对步骤(1)所生成的人脸身份信息数据表进行聚类分析,将人脸特征向量每一维特征聚为N个分类,N为自然数;(3)由步骤(2)可获得人脸特征向量每一维特征聚类分析结果,将该结果中的每一个分类在中间层中单独创建一张以人脸身份信息唯一ID为“键”,人名为“值”的聚类名单表,以HBase方式储存;(4)在中间层中建立一个以自增自然数为主键,以人脸特征向量维度编号、聚类分类编号、聚类分类中心值及聚类名单表编号为属性的人脸特征向量聚类索引表;(5)将步骤(2)所得聚类分析结果与步骤(3)所建立的每一张聚类名单表编号信息一起插入到步骤(4)所建立的人脸特征向量聚类索引表中,该人脸特征向量聚类索引表与所有聚类名单表一起构成信息索引表。
关 键 词:
法律状态:公开
IPC专利分类号:G06F17/30(2006.01)I;G06K9/00(2006.01)I