专利类型:发明专利
语 言:中文
申 请 号:CN201610662641.2
申 请 日:20160814
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20161221
公 开 号:CN106250549A
代 理 人:唐开平
代理机构:重庆大学专利中心 50201
摘 要:本发明公开了一种基于内存的频繁模式挖掘方法,它包括以下步骤:步骤1,构建频繁模式初始树,创建频繁模式树的根结点T,以“null”标记;再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。本发明的技术效果是:能减少对NVM的写操作,能快速的构建频繁模式树;且能减少对靠近根结点的结点计数域大量密集的写操作,延长了NVM寿命。
主 权 项:一种基于内存的频繁模式挖掘方法,其特征是,包括以下步骤:步骤1,构建频繁模式初始树1)、依次扫描数据库中的每一条交易记录,获得数据库中所包含的全部项的支持度计数,排除支持度计数值小于阈值的项,剩余的项即为频繁项,对频繁项按其支持度计数降序排列得到一个列表L;2)、创建频繁模式树的根结点T,以“null”标记;3)、再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。
关 键 词:
法律状态:生效
IPC专利分类号:G06F17/30(2006.01)I