[发明专利]基于半监督局部线性回归的自适应参数软测量方法有效
申请号: | 201210147645.9 | 申请日: | 2012-05-11 |
公开(公告)号: | CN102708294A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 阎威武;李哲;王国良;陈世和;张曦 | 申请(专利权)人: | 上海交通大学;广东电网公司电力科学研究院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 局部 线性 回归 自适应 参数 测量方法 | ||
1.一种基于半监督局部线性回归的自适应参数软测量方法,其特征在于,首先将未标记样本引入局部线性回归的流形正则化函数进行模型求解,得到半监督局部线性回归的学习方法;接着采用适用于半监督局部线性回归的自适应参数选择方法,使得模型能够过滤掉标记样本中测量误差带来的影响;最后将自适应参数的半监督局部线性回归方法基于滚动时间窗的方式,实现软测量模型的在线更新。
2.根据权利要求1所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的半监督局部线性回归学习方法是指:假设xi∈X,i=1,2,…,n为输入数据集X中的数据点,βi∈B,i=1,2,…,n分别为各数据点上的局部线性系数向量,其中n为总数据个数,B为所有局部线性系数向量组成的系数矩阵,则通过求解下式可以得到某输入数据点xi的局部线性系数向量
其中l为标记数据个数,n为总数据个数;wij为某两个数据点xi和xj之间的相似度,这里wij由高斯核函数给出,即 h为高斯核宽,用于调节相似数据点的范围;除此以外,βi的计算公式中 γ为半监督系数,当该值为0时,算法退化为监督算法。
3.根据权利要求1或2所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的适应于半监督局部线性回归的自适应参数选择方法是指:通过计算标记样本集中标记样本的估计斜率,来自适应得到一个半监督局部线性回归中高斯核函数的高斯核宽h,从而选取一个合适的高斯核宽使方法预测精度提高。
4.根据权利要求3所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的适应于半监督局部线性回归的自适应参数选择方法,具体步骤如下:首先对部分事先已经获得的输入数据进行离线实验,找出一个适应于这些数据的最优高斯核宽,记为ho;再通过下式计算这些数据的估计斜率,
记为k0,其中yi为标记样本集中某一标记样本的标记值,ni为标记样本集中某一标记样本在全部数据集中的顺序编号,v为标记样本集中标记样本的个数;当标记样本集更新以后,按上式重新计算估计斜率k,则自适应的高斯核宽 再利用该参数进行半监督局部线性回归的变量预测,其中,所述全部数据集包括标记样本和未标记样本,所述顺序编号按获取时间排序。
5.根据权利要求1至4中任一项所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的在线更新是指:对标记数据集XL,全部数据集X和预测集 随着数据的读取,进行数据的处理和预测,同时更新这个三个数据集。
6.根据权利要求1至5中任一项所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的基于滚动时间窗的方法是指按时间来对数据集进行更新,即如果获取一个数据点是标记样本,则将其加入到标记数据集中,并从标记数据集中去掉一个最早的数据以使标记数据集中的标记样本数目维持在一个定制,并不断通过对实时变化的标记数据集和全部数据进行软测量模型的建模和预测,实现模型的不断更新,更适应于新获取的数据,避免模型的过学习问题。
7.根据权利要求5或6所述的基于半监督局部线性回归的自适应参数软测量方法,其特征在于,所述的基于滚动时间窗的方法是指按时间来对数据集进行更新,具体过程是这样的:首先利用XL和X进行基于半监督局部线性回归的软测量模型建立,并对数据点进行预测得到测量结果,更新 接着读取新数据,更新XL和X,重新进行基于半监督局部线性回归的软测量模型建立和结果预测,不断循环下去直到预测终止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;广东电网公司电力科学研究院,未经上海交通大学;广东电网公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210147645.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:包覆基板侧边的模封阵列处理方法
- 下一篇:造纸增强剂添加工艺及设备
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用