浏览量:0

多类别集工业过程数据相似度分析方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201810271196.6 

申 请 日:20180329 

发 明 人:张可柴毅程传阳游丹妮 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙坪坝正街174号 

公 开 日:20180821 

公 开 号:CN201810271196.6 

代 理 人:胡柯 

代理机构:北京众合诚成知识产权代理有限公司 11246 

摘  要:一种多类别集工业过程数据相似度分析方法,具体步骤为:1)设定类别集;2)采集实际数据,并进行预处理;3)形成若干数据集;4)从每个数据集中抽取部分数据并做标记,作为该数据集的代表数据;5)针对每个数据集的代表数据,进行不同维度的相似度分析,生成相似度数值表;6)修正相似度数值表。本发明针对不同的数据维度,对部分数据特征进行相似度分析,从而实现对不同类别集的数据进行相似度分析,来找出各类别集之间存在的隐含联系,研究系统中产生不同运行状态的原因,以便于数据的挖掘、检索与分析,寻找工况产生的原因。 

主 权 项:1.一种多类别集工业过程数据相似度分析方法,其特征在于,具体步骤如下:1)根据已有样本数据,设定类别集;2)采集实际数据,并对实际数据进行预处理;3)对步骤2)处理后的实际数据,根据步骤1)设定的类别集进行分类,形成若干数据集;4)从步骤3)中的数据集抽取数据,标记数据来源,作为该类别集的代表数据;5)针对类别集中每个实际数据的特征,对该类别集中的代表数据进行不同维度的相似度分析,形成相似度数值表;6)从步骤3)中的数据集重新抽取数据,标记数据来源,作为该类别集的新的代表数据,对该类别集中的新代表数据进行不同维度的相似度分析,形成新的相似度数值表;7)对相似度数值表进行修正,得到修正后的相似度数值表;8)对步骤7)中的相似度数值表,多次重复步骤6)与步骤7),当表中的数值都稳定在某个值附近时,结束循环;否则,应继续增加重复的次数。 

关 键 词:相似度分析;数据集;工业过程数据;数值表;相似度;预处理;实际数据;数据集中;数据特征;数据维度;研究系统;运行状态;维度;隐含;抽取;检索;采集;修正;挖掘;分析 

法律状态:公开 

IPC专利分类号:G06F17/30;G06F17/00;G;G06;G06F;G06F17;G06F17/30;G06F17/00