浏览量:0

基于目标域迁移极限学习的电子鼻异构数据识别方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201610216768.1 

申 请 日:20160408 

发 明 人:张磊邓平聆刘燕田逢春刘涛 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20160831 

公 开 号:CN105913079A 

代 理 人:黄河 

代理机构:重庆博凯知识产权代理有限公司 50212 

摘  要:本发明提供了一种基于目标域迁移极限学习的电子鼻异构数据识别方法,其从机器学习角度提出域迁移极限学习机框架用于解决传感器漂移问题,利用电子鼻在未发生漂移时采集的气体传感器阵列感测数据矩阵以及发生漂移后采集的有标签的和无标签的气体传感器阵列感测数据矩阵分别构建源域数据集、目标域数据集和待测域数据集,并分别作为极限学习机的输入,对电子鼻的识别分类器进行学习,以提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,达到漂移补偿和提高对气体识别中异构数据样本的识别精度的目的,并且持了极限学习机的技术优点,使得该方法具备了较好的泛化性和迁移性能,能够在不同的电子鼻产品针对不同的气体识别应用上广泛适用。 

主 权 项:基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,包括如下步骤:1)获取电子鼻在未发生漂移时所采集的NS个有标签的气体传感器阵列感测数据矩阵作为源域数据集对应的标签集合任意的第i个源域数据样本为电子鼻在未发生漂移时进行一次气体检测所得到的气体传感器阵列感测数据矩阵,i∈{1,2,…,NS},即:XSi=[xSi,1,xSi,2,...,xSi,n,...,xSi,N]T;其中,表示第i个源域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N},N表示电子鼻气体传感器阵列中所包含的气体传感器数量;上角标T为转置符号;所述第i个源域数据样本的标签为:tSi=[tSi,1,tSi,2,...,tSi,m,...,tSi,M]T;其中,表示第i个源域数据样本在第m类目标气体类别序号上的类别标签值,若对第i个源域数据样本的识别结果为属于第m类气体,则令否则令由此构成第i个源域数据样本的标签m∈{1,2,…,M},M表示电子鼻所能够识别的目标气体种类数;2)获取电子鼻在发生漂移后所采集的NT个有标签的气体传感器阵列感测数据矩阵作为目标域数据集对应的标签集合任意的第j个目标域数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,j∈{1,2,…,NT},即:XTj=[xTj,1,xTj,2,...,xTj,n,...,xTj,N]T;其中,表示第j个目标域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;所述第j个目标域数据样本的标签为:tTj=[tTj,1,tTj,2,...,tTj,m,...,tTj,M]T;其中,表示第j个目标域数据样本在第m类目标气体类别序号上的类别标签值,若对第j个目标域数据样本的识别结果为属于第m类气体,则令否则令由此构成第j个目标域数据样本的标签m∈{1,2,…,M};3)获取电子鼻在发生漂移后所采集的NU个未标记标签的气体传感器阵列感测数据矩阵作为待测域数据集任意的第k个待测数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,k∈{1,2,…,NU},即:XUk=[xUk,1,xUk,2,...,xUk,n,...,xUk,N]T;其中,表示第k个待测数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;4)设定源域数据样本的预测误差惩罚系数CS、目标域数据样本的预测误差惩罚系数CT和待测数据样本的预测误差惩罚系数CU,且设定源域极限学习机和目标域极限学习机的隐含层神经元个数均为NL;5)随机初始化源域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量然后,将源域数据集XS作为源域极限学习机的输入,计算得到相应的源域极限学习机的隐含层输出矩阵HS=gS(W1·XS+b1);其中,gS(·)表示源域极限学习机的激活函数;6)判断源域数据集所包含的源域数据样本个数NS与源域极限学习机隐含层神经元个数NL的数值关系;若NS≥NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵βB=(HSTHS+ILCS)-1HSTTS;其中,IL为NL×NL的单位矩阵;若NS<NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵βB=HST(HSHST+ISCS)-1TS;其中,IS为NS×NS的单位矩阵;上角标T均为转置符号;7)随机初始化目标域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量然后,将目标域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵HT=gT(W2·XT+b2);将待测域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵HU=gT(W2·XU+b2);其中,gT(·)表示目标域极限学习机的激活函数;由此得到的对应的隐含层输出矩阵表示第k个待测数据样本所对应的隐含层输出向量;8)判断目标域数据集所包含的目标域数据样本个数NT与目标域极限学习机隐含层神经元个数NL的数值关系;若NT≥NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵βT=(IL+CT·HTT·HT+CU·HUT·HU)?1(CT·HTT·TT+CU·HUT·HU·βB);其中,IL为NL×NL的单位矩阵;若NT<NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵βT=HTT·FTU+HUT(FP?1·TU?FP?1·FO·FTU);其中,FTU、FO、FP、FQ和FR均为缩写式,其各自的展开式为:FTU=(FQ·FP?1·FO?FR)?1(FQ·FP?1·TU?TT);FO=HUHTTFQ=HTHUT其中,TU=HUβB,IT为NT×NT的单位矩阵;上角标T均为转置符号;9)将步骤8)所得到的目标域极限学习机的隐含层与输出层之间的权重矩阵βT作为电子鼻的识别分类器,按下式分别计算待测域数据集中各个待测数据样本所对应的标签:yUk=hUk·βT,k{1,2,...,NU};其中,表示计算得到的第k个待测数据样本的标签,且:yUk=[yUk,1,yUk,2,...,yUk,m,...,yUk,M]T;表示第k个待测数据样本在第m类目标气体类别序号上的类别标签值;对于第k个待测数据样本将其标签中最大类别标签值所在的目标气体类别序号所对应的目标气体类别判定识别为待测数据样本所属的气体类别;由此,判定得到待测域数据集中各个待测数据样本的气体类别识别结果。 

关 键 词: 

法律状态:公开 

IPC专利分类号:G06K9/62(2006.01)I;G06N3/08(2006.01)I;G01N27/00(2006.01)I