专利类型:发明专利
语 言:中文
申 请 号:CN201810321941.3
申 请 日:20180411
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙坪坝正街174号
公 开 日:20180921
公 开 号:CN201810321941.3
代 理 人:赵荣之
代理机构:北京同恒源知识产权代理有限公司 11275
摘 要:本发明涉及一种基于迭代决策树的电信用户分类方法,包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从G(V,E)中抽取特征,或根据已分类的用户更新其他用户的特征;S3:用迭代决策树对G(V,E)中未分类的用户分类,即判断是否满足|sFriend?nFriend|≥L;若满足则分类,将分类的用户数记为κ;K若κ>K,回到步骤S2,否则进入步骤S4;S4:令L=L?1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。本发明在训练集较少的情况下能达到很低的错误率,可以克服训练集占比高导致的过拟合影响,实现用户的精准定位。
主 权 项:1.一种基于迭代决策树的电信用户分类方法,其特征在于:包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从用户社交关系网络G(V,E)中抽取特征,或者根据已分类的用户更新其他用户的特征;S3:应用迭代决策树算法对G(V,E)中所有未分类的用户进行分类,即判断用户的学生好友与非学生好友的数量差是否超过了阈值参数L,即是否满足|sFriend?nFriend|≥L;若满足,则对用户进行分类,并将成功分类的用户数记为κ;若κ>K,回到步骤S2,否则进入步骤S4;其中,参数sFriend表示社交关系网络G(V,E)中某用户的学生好友数,参数nFriend表示社交关系网络G(V,E)中某用户的非学生好友数,参数L为可动态调整的阈值参数,K为预设的用于判断是否继续迭代的迭代参数;S4:令L=L?1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。
关 键 词:分类;决策树;迭代;电信用户;训练集;短信记录;分类结果;关系网络;基本信息;精准定位;用户分类;用户更新;用户社交;错误率;构建;拟合;抽取;通话;输出;返回
法律状态:生效
IPC专利分类号:G06Q30/00;G06Q50/00;G06Q50/30;G06Q50/00;G;G06;G06Q;G06Q30;G06Q50;G06Q30/00;G06Q50/00;G06Q50/30;G06Q50/00