浏览量:0

一种基于相邻数据特征的数据缺失填充方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201610397552.X 

申 请 日:20160602 

发 明 人:王有元陈伟根杜林李剑周湶刘玉王飞鹏周立玮杜修明杨祎朱孟兆 

申 请 人:重庆大学国网山东省电力公司 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20161123 

公 开 号:CN106155985A 

代 理 人:王翔 

代理机构:重庆大学专利中心 50201 

摘  要:本发明的目的是为解决利用数据对设备进行故障诊断时出现数据缺失的问题,公开了一种基于相邻数据特征的数据缺失填充方法。其过程中,找到缺失值位置,利用系统在线监测数据不能骤然变化并具有一定周期性的特点,挖掘缺失值与其相邻数据、与相邻数据相等的数据之间的关系,进而对缺失值进行填充。 

主 权 项:一种基于相邻数据特征的数据缺失填充方法,其特征在于:读取一段按照时间顺序排列的数据序列;所述数据序列中,存在n个数据,所述数据序列为data(x1)、data(x2)……data(xn)表示,x1、x2……xn为时间序列Q,n为自然数;所述数据序列中,缺失了编号为i的数据,即data(i),i为等差数列Q中的一个值;填充编号为i的数据,包括以下步骤:1)读取与编号为i的数据相邻的数据data(i?1);在所述数据序列中,从头开始寻找与data(i?1)之差的绝对值小于0.02的数据;如果没有找到这样的数据,则下一步直接进入步骤5);如果找到这样的一个或多个数据,令其中一个数据的序列号为k?1,即该数据记为data(k?1),并进入下一步,k为时间序列Q中的一个值;2)读取data(k)和data(i)左边的三个数据,将data(k?3)、data(k?2)和data(k?1)进行一次拟合,data(i?3)、data(i?2)和data(i?1)进行一次拟合;如果data(k?3)、data(k?2)和data(k?1)的变化趋势与data(i?3)、data(i?2)和data(i?1)的变化趋势相同,则进入下一步;否则,回到步骤1),重新选取data(k?1),但无法通过步骤1)选取data(k?1)时,则进入步骤5);3)读取data(k)和data(i)右边的三个数据,将data(k+3)、data(k+2)和data(k+1)进行一次拟合,data(i+3)、data(i+2)和data(i+1)进行一次拟合;如果data(k+3)、data(k+2)和data(k+1)的变化趋势与data(i+3)、data(i+2)和data(i+1)的变化趋势相同,则进入下一步;否则,回到步骤1),重新选取data(k?1),但无法通过步骤1)选取data(k?1)时,则进入步骤5);4)将data(k)保存到数据集K中,回到步骤1),重新选取data(k?1),直到无法通过步骤1)选取data(k?1)时,进入下一步;5)若被保存数据只有1个数据data(k),则若没有数据被保存下来,则取缺失值data(i)左右两侧数据的平均值。如果数据集K存在j?1(j>2)个数据,则将数据集K里面的数据拟合为f(x),令M=f(j);6)将数值M填充到data(i)的位置上。 

关 键 词: 

法律状态:公开 

IPC专利分类号:G06F17/18(2006.01)I