[发明专利]一种传感器数据校准模型的学习方法有效

申请号：	201710014247.2	申请日：	2017-01-09
公开（公告）号：	CN106909972B	公开（公告）日：	2020-04-10
发明（设计）人：	董玮;卜佳俊;高艺;陈纯;陈远	申请（专利权）人：	浙江大学
主分类号：	G06N20/00	分类号：	G06N20/00
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵;黄美娟
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种传感器数据校准模型学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种传感器数据校准模型的学习方法，特别是线性学习器和非线性学习器的重要性判定、学习程度的控制方法以及线性学习器和非线性学习器的结合方法。

背景技术

由于受到时间偏移，环境因素，移动场景等方面的影响，传感器的数据较真实值之间具有较大的偏差。Air-cloud使用实现了面向每个人的空气质量监测系统，其中实验表明PM2.5传感器的原始数据和真实值之间的关系是非线性的。融合了温湿度特征，Air-cloud使用基于线性人工神经网络的校准方法，并在云端实现了数据校准的模型。基于神经网络的多元线性回归模型相对于一元线性回归有了较大提升，但校准后数据相对于真实值偏差仍然较大。目前数据校准方法都是基于多元线性回归模型，在粒子传感器的数据校准上表现较差。

机器学习的回归方法可以分为线性回归方法和树回归方法。线性回归方法可以分为最小二乘回归，岭回归，基于人工神经网络的多元线性回归。性回归方法可以有效的拟合所有样本点(局部加权线性回归除外)。当数据拥有众多特征并且特征之间关系十分复杂时，构建全局模型的想法一个是困难一个是笨拙。此外，实际中很多问题为非线性的，例如常见到的分段函数，不可能用全局线性模型来进行拟合。树回归将数据集切分成多份易建模的数据，然后利用线性回归进行建模和拟合。最经典的树回归是CART(classification and regression trees，分类回归树)算法。利用集成学习将多个基回归器组合，可以起到增强的作用。目前随机森林回归和渐进梯度回归树(GBRT)。

针对多元线性回归模型在数据校准中缺点，本文提出了一种传感器数据校准模型的学习方法。

发明内容

本发明要克服现有技术的上述缺点,提供了一种传感器数据校准特征的提取和评估方法。

为实现以上目的，本发明所采取的技术方案是：一种传感器数据校准模型的学习方法，包括以下步骤：

步骤1，线性学习器和非线性学习器的重要性学习，包括：

(1.1)选择学习器，选择合适的线性学习器和非线性学习器。线性学习器选择多元线性回归模型，如线性人工神经网络(ANN)和多元最小二乘；非线性学习器选择树回归模型，如CART回归树，随机森林和渐进梯度回归树(GBRT)。

(1.2)学习器的多样性增强，通过引入数据样本扰动和输入属性扰动来增强学习器的多样性。

(1.3)学习器训练，分别对线性学习器和非线性学习器进行训练。

(1.4)权重的二次学习，利用二次学习法来学习线性学习器和非线性学习的权重。

(1.5)重要性判断，通过权重的值来判断线性学习器和非线性学习器结合策略

步骤2，通过相关理论控制第一轮学习的程度，包括：

(2.1)控制第一轮学习的程度，通过输入特征子集来控制第一轮学习的程度，通过相关理论来选择合适的特征子集。