浏览量:0

一种基于频数分布的数据离散化方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201711077429.0 

申 请 日:20171106 

发 明 人:王有元廖瑞金赵玉顺何怡刚陈伟根杜林李剑梁玄鸿刘航 

申 请 人:重庆大学合肥工业大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20180515 

公 开 号:CN108038123A 

代 理 人:王翔 

代理机构:重庆大学专利中心 50201 

摘  要:本发明公开了一种基于频数分布的数据离散化方法,其特征在于:包括以下步骤:1)对某种对象的历史数据进行收集,绘制出频数分布曲线图;2)分别选取频数分布曲线图中的波峰值,作为划分离散化区间的依据,完整的波峰的数量即为离散化区间的数量;3)将波峰处的横坐标值作为拟合正态分布的期望值μ,选择离波峰最近的一个波谷作为拟合正态分布的μ±σ,得到正态分布的标准差σ;根据期望值与标准差即得到该波峰拟合的正态分布模型,将相邻两个区间所得的拟合正态分布的概率密度函数交点处作为区间的边界;4)列出所求区间的边界,完成数据区间的离散化。 

主 权 项:一种基于频数分布的数据离散化方法,其特征在于,包括以下步骤:1)对某种对象的历史数据进行收集,绘制出频数分布曲线图;2)分别选取频数分布曲线图中的波峰值,作为划分离散化区间的依据,完整的波峰的数量即为离散化区间的数量;3)将波峰处的横坐标值作为拟合正态分布的期望值μ,选择离波峰最近的一个波谷作为拟合正态分布的μ±σ,得到正态分布的标准差σ;根据期望值与标准差即得到该波峰拟合的正态分布模型,将相邻两个区间所得的拟合正态分布的概率密度函数交点处作为区间的边界;4)列出所求区间的边界,完成数据区间的离散化。 

关 键 词:正态分布;离散化;频数分布;波峰;拟合;标准差;概率密度函数;正态分布模型;历史数据;数据区间;交点处;波谷;绘制 

法律状态: 

IPC专利分类号:G06F17/30(2006.01)I,G01R31/02(2006.01)I