浏览量:0

一种基于微调条件概率的分类数据转换方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201910770010.6 

申 请 日:20190820 

发 明 人:熊庆宇李秋德吉胜芬高旻余洋王凯歌吉皇 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20191126 

公 开 号:CN110502552A 

代 理 人:胡长生 

代理机构:重庆中流知识产权代理事务所(普通合伙) 

摘  要:本发明涉及数据预处理的数据挖掘或机器学习领域,本发明提出的一种基于微调条件概率的分类数据转换方法,包括:S1、分类数据的数据采集;S2、数据预处理,清洗分类数据中的缺失数据,噪音数据,以及无效数据;S3、条件概率计算,将清洗以后的分类数据转换为数值向量;S4、微调条件概率,对步骤S3中转换后的数值向量进行数值微调;S5、分类数据的数值嵌入,对步骤S4中进行数值微调以后的数值向量,采用原始的分类数据嵌入或映射为数值数据。本发明可将分类数据集中的分类值转换为高质量的数值向量,转换后的数值数据能保持原始数据的真实分布,保证了数据挖掘任务的可靠性。 

主 权 项:1.一种基于微调条件概率的分类数据转换方法,其特征在于,包括:S1、分类数据的数据采集;S2、数据预处理,清洗分类数据中的缺失数据,噪音数据,以及无效数据;S3、条件概率计算,将清洗以后的分类数据转换为数值向量;S4、微调条件概率,对步骤S3中转换后的数值向量进行数值微调;S5、分类数据的数值嵌入,对步骤S4中进行数值微调以后的数值向量,采用原始的分类数据嵌入或映射为数值数据。 

关 键 词: 

法律状态: 

IPC专利分类号:G06F16/2458;G06F16/215;G06N20/00