专利类型:发明专利
语 言:中文
申 请 号:CN201610369540.6
申 请 日:20160530
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20161109
公 开 号:CN106097097A
代 理 人:
代理机构:
摘 要:本发明涉及一种采用流形学习对股票数据进行降维去噪的方法。其特征在于,通过逼近每个数据点邻域的切空间来描述数据集的局部几何结构,再将这些局部切空间进行全局排列,得到整体低维嵌入坐标,实现股票原始数据高维到低维空间的线性映射。具体步骤为:1.股票数据集的表示;2.求取数据点邻域;3.提取局部信息;4.整合局部信息;5.求得转换矩阵;6.计算得到降维后的股票数据集。
主 权 项:一种股票数据降维去噪的方法,其特征在于,包括以下步骤:a)股票数据集的表示假设含噪声的股票数据集S=[s1,s2,...,sn]是Md空间中一个潜在的d维非线性流形,且嵌入在高维的欧几里德空间Rm中,其中d<m,线性局部切空间排列算法的目标是找到一个转换矩阵A,将S映射到低维空间Rd中,得到降维后的样本集O=[o1,o2,...,on];b)求取数据点邻域对S数据集中的每一个数据点si,i=1,...,n,根据距离决定其k个邻域sij,j=1,...,k.得到包含邻域信息的数据集S,Si=[si1,si2,...,sik];c)提取局部信息计算矩阵SiHK的d个最大特征值对应的特征向量,得到矩阵Vi,使得Wi=Hk(I?ViViT),其中Hk=I?eeT/k为中心化矩阵;d)整合局部信息对局部坐标进行全局排列,即找到一个局部排列转换矩阵,将所有数据点对应的切空间局部坐标映射到低维全局空间,并使得误差和最小;e)求得转换矩阵A对公式(3)求取其最小的d个广义特征值对应的广义特征向量:SHnBHnSTα=λSHnSTα,得到的特征向量α1,α2,...,αd组成的矩阵A即为所求,A=[α1,α2,...,αd]。
关 键 词:
法律状态:生效
IPC专利分类号:G06Q40/04(2012.01)I;G06F17/16(2006.01)I