浏览量:0

一种高致病性禽流感病毒血凝素蛋白识别方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN200810069933.0 

申 请 日:20080707 

发 明 人:梁桂兆梅虎杨力李志良 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20100609 

公 开 号:CN101308526B 

代 理 人: 

代理机构: 

摘  要:本发明公开了一种高致病性禽流感病毒血凝素蛋白识别方法,能够用于高致病性禽流感病毒血凝素蛋白识别,可为理解高致病性禽流感病毒血凝素蛋白的结构特征提供参考,通过对血凝素蛋白的识别,从而可以间接地判别其所属的禽流感病毒株的致病性高低,包括如下步骤:a)基于主成分分析方法,建立氨基酸全息拓扑结构得分矢量;b)应用氨基酸全息拓扑结构得分矢量对流感病毒血凝素蛋白的结构进行表征;c)用自交叉协方差方法对每个流感病毒血凝素蛋白的表征变量做归一化处理;d)用径向基核支持向量机建立禽流感病毒血凝素蛋白识别模型;e)用径向基核支持向量机建立高致病性禽流感病毒血凝素蛋白识别模型。 

主 权 项:一种高致病性禽流感病毒血凝素蛋白识别方法,其特征在于包括如下步骤:a)具体包括a1)精选23种氨基酸的1262种性质参数;a2)对1262种性质参数做主成分分析,得到22个主成分;a3)计算各主成分得分,将得分矢量定义为氨基酸全息拓扑结构得分;b)用氨基酸全息拓扑结构得分所涉及的22个主成分对流感病毒血凝素蛋白序列进行表征,其中的每个氨基酸残基用22个氨基酸全息拓扑结构得分矢量表征;c)用自交叉协方差处理得到的每个血凝素蛋白的表征变量,设置步长l为6,使每个血凝素蛋白的表征变量数目一致,并将经自交叉协方差处理得到的变量作为高致病性禽流感病毒血凝素蛋白识别模型的自变量;d)以1和-1两个指示变量分别表示禽流感病毒血凝素蛋白样本和非禽流感病毒血凝素蛋白样本,并以此指示变量作为禽流感病毒血凝素蛋白识别模型的因变量,用径向基核支持向量机建立禽流感病毒血凝素蛋白识别模型,将每个蛋白样本的自变量带入模型并计算,若得1,则该蛋白样本被识别为禽流感病毒血凝素蛋白样本,若得-1,则该蛋白样本被识别为非禽流感病毒血凝素蛋白样本;e)以1和-1两个指示变量分别表示高致病性禽流感病毒血凝素蛋白样本和低或非致病性禽流感病毒血凝素蛋白样本,并以此指示变量作为高致病性禽流感病毒血凝素蛋白识别模型的因变量,用径向基核支持向量机建立高致病性禽流感病毒血凝素蛋白识别模型,将每个蛋白样本的自变量带入模型并计算,若得1,则该蛋白样本被识别为高致病性禽流感病毒血凝素蛋白样本,若得-1,则该蛋白样本被识别为低或非致病性禽流感病毒血凝素蛋白样本。 

关 键 词: 

法律状态:公开 

IPC专利分类号:G06F19/00(2006.01)I