浏览量:0

基于数据挖掘的异常检测方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201110283015.X 

申 请 日:20110922 

发 明 人:唐朝伟时豪严鸣张雪臻李超群杨磊 

申 请 人:重庆大学 

申请人地址:400045 重庆市沙坪坝区沙正街174号 

公 开 日:20131127 

公 开 号:CN102324007B 

代 理 人:郭云 

代理机构:重庆市前沿专利事务所(普通合伙) 50211 

摘  要:本发明公开了一种基于数据挖掘的异常检测方法,属于网络安全技术领域。该异常检测方法基于独立分量分析和Adaboost方法,首先用Fast-ICA算法进行特征提取,以消除冗余属性,降低数据维数。AdaBoost方法依次训练一组弱分类器,将它们集成为一个强分类器。通过本发明,有效地消除网络数据中的冗余属性信息,减少了分类器的训练和检测的运算量;同时也提高了检测的精度,降低样本误报和漏报的概率。 

主 权 项:一种基于数据挖掘的异常检测方法,其特征在于:由以下步骤组成:S1、以网络数据作为观测变量,采用FAST?ICA方法从所述观测变量中提取观测变量特征,构成观测变量特征集合Z,即获得消除冗余属性且降低数据维数的网络数据特征;S2、采用ADABOOST方法训练观测变量特征:以观测变量特征集为训练集,各观测变量特征作为训练文本,向各训练文本赋予一个权值,其中所述权值用于表示所述训练文本被弱分类器选入训练集的概率,当弱分类器训练结束后,根据训练集的分类结果调节各训练文本的权重:如果所述训练样本被所述弱分类器精确分类,则所述弱分类器的权重降低,则其被下一弱分类器选入训练集的概率降低;如果所述训练样本未被所述弱分类器精确分类,则其被下一弱分类器选入训练集的概率提升,最终获得强分类器;S3、根据所述强分类器对异常网络数据进行检测。 

关 键 词: 

法律状态:生效 

IPC专利分类号:G06F21/55