专利类型:发明专利
语 言:中文
申 请 号:CN201110074609.X
申 请 日:20110328
申 请 人:重庆大学
申请人地址:400044重庆市沙坪坝区沙正街174号
公 开 日:20110817
公 开 号:CN102156825A
代 理 人:
代理机构:
摘 要:本发明公开了一种基于数据挖掘的癌症疫苗试验数据编码及处理方法,属于生物信息技术领域。该方法主要涉及癌症疫苗试验数据的特征分析、癌症疫苗试验数据的编码和癌症疫苗试验数据的挖掘处理。本发明将癌症疫苗试验数据分为四类并采取“整数分段标识法”来进行编码,最后把编码的数字视为数据挖掘中的“项”来进行挖掘处理。该方法能从癌症疫苗试验数据中发现知识和规律,对于探索生命科学和制药工程具有重要的意义。??全部
主 权 项:一种基于数据挖掘的癌症疫苗试验数据编码及处理方法,其特征在于:首先对癌症疫苗试验数据进行特征分析[1],然后进行“整数分段标识法”编码[2],最后进行关联规则挖掘处理[3],其中:对癌症疫苗试验数据进行特征分析[1]:是指根据癌症疫苗试验数据的字段属性[4]分析其取值情况,并根据取值情况将它们分为不同的类型,以供分别进行编码;进行“整数分段标识法”编码[2]:是指根据癌症疫苗试验数据的特征分析[1]结果,采用“整数分段标识法”进行编码;“整数分段标识法”编码[2]用一个长度为5的整数表示一个编码,其中,前3位标识属性,后2位标识该属性的取值;进行关联规则挖掘处理[3]:是指将经过“整数分段标识法”编码[2]的数据视为数据挖掘中的“项”,通过统计不同“项”同时出现的频率来挖掘它们之间存在的关联关系;其中,“项”是数据挖掘中的基本单位,用来标识一个商品或属性的取值。
关 键 词:
法律状态:生效
IPC专利分类号:G06F19/28(2011.01)I