浏览量:0

一种基于内存的频繁模式挖掘方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201610662641.2 

申 请 日:20160814 

发 明 人:刘铎林怡黄柏钧朱潇 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20161221 

公 开 号:CN106250549A 

代 理 人:唐开平 

代理机构:重庆大学专利中心 50201 

摘  要:本发明公开了一种基于内存的频繁模式挖掘方法,它包括以下步骤:步骤1,构建频繁模式初始树,创建频繁模式树的根结点T,以“null”标记;再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。本发明的技术效果是:能减少对NVM的写操作,能快速的构建频繁模式树;且能减少对靠近根结点的结点计数域大量密集的写操作,延长了NVM寿命。 

主 权 项:一种基于内存的频繁模式挖掘方法,其特征是,包括以下步骤:步骤1,构建频繁模式初始树1)、依次扫描数据库中的每一条交易记录,获得数据库中所包含的全部项的支持度计数,排除支持度计数值小于阈值的项,剩余的项即为频繁项,对频繁项按其支持度计数降序排列得到一个列表L;2)、创建频繁模式树的根结点T,以“null”标记;3)、再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。 

关 键 词: 

法律状态:生效 

IPC专利分类号:G06F17/30(2006.01)I