专利类型:发明专利
语 言:中文
申 请 号:CN201410234156.6
申 请 日:20140529
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20170412
公 开 号:CN103984756B
代 理 人:李明
代理机构:重庆博凯知识产权代理有限公司 50212
摘 要:本发明提供了一种基于半监督概率潜在语义分析的软件变更日志分类方法,该方法结合了先验知识所确定的单词字典,并根据单词与单词之间的概率相关性、单词与变更日志类别之间的概率相关性、以及软件变更日志自身与变更日志类别之间的概率相关性,客观地对软件变更日志进行分类,避免了依据词频特性的权重值进行软件变更日志的分类,使得分类的准确性得以提升,有效地解决了现有技术中因人为设定权重值导致软件变更日志分类存在误差、准确性较低的问题。
主 权 项:基于半监督概率潜在语义分析的软件变更日志分类方法,其特征在于,包括如下步骤:A)根据先验知识,划分变更日志类别,并确定每个变更日志类别对应的关键单词,将各个变更日志类别对应的全部关键单词的集合作为单词字典;所述单词字典中每个变更日志类别对应的一个关键单词,是根据先验知识对属于相应变更日志类别的软件变更日志进行词干提取所获得的词干中的一个单词;所述变更日志类别具体划分为三类,即:第1个变更日志类别z1:修复软件损坏、错误或缺陷所产生的软件变更日志;第2个变更日志类别z2:新增软件功能或软件特征所产生的软件变更日志;第3个变更日志类别z3:对软件进行重新编辑或重新构建所产生的软件变更日志;B)获取若干个属于上述三个变更日志类别且所属变更日志类别已知的软件变更日志作为训练样本
关 键 词:
法律状态:生效
IPC专利分类号:G06F17/30; G06F17/27