[发明专利]一种基于贝叶斯推理的轨道交通监测数据清洗方法及系统有效
申请号: | 202211127267.8 | 申请日: | 2022-09-16 |
公开(公告)号: | CN115700494B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 孙立;李秋义;李琦;朱彬;黄永;张政;林超;李路遥 | 申请(专利权)人: | 哈尔滨工业大学;中铁第四勘察设计院集团有限公司;中国铁建股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N3/042;G06N3/047;G06N3/048;G06N3/0495;G06N3/0985;G06N5/04 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 邓宇 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 推理 轨道交通 监测 数据 清洗 方法 系统 | ||
1.一种基于贝叶斯推理的轨道交通监测数据清洗方法,其特征在于,具体包括以下步骤:
步骤一、基于极限学习机神经网络模型,输入部分轨道温度和应变监测数据作为训练数据,利用稀疏贝叶斯学习方法求解极限学习机神经网络模型输出层的权重参数,进而得到轨道交通监测数据中温度与结构应变响应之间非线性回归关系;
步骤二、以通过训练得到的稀疏贝叶斯极限学习机温度与结构应变响应之间非线性回归关系为基准,按预测误差绝对值大小将温度和应变监测数据组成的轨道交通联合监测数据划分成规律数据集和可疑数据集,通过贝叶斯推理得到轨道交通监测可疑数据集各数据点异常概率的计算结果;
步骤三、选择数据异常概率的阈值,将异常概率小于该阈值的数据点重新划分到规律数据集中,大于该阈值的数据点作为识别出来的异常值放入数据集S中,将更新后的规律数据集重新作为训练数据训练极限学习机非线性回归模型,重复步骤一和二,往复迭代,直至可疑数据集中每一个数据点的概率均小于该阈值,此时数据集S中的数据点即为识别出来的异常值;
步骤四、对于步骤三选取不同的阈值,对比最终的识别结果,根据识别结果的差异选取出最合理的数据异常概率的阈值,最后将识别的异常数据在监测数据中剔除,实现数据的清洗。
2.根据权利要求1所述的方法,其特征在于,所述步骤一具体为:
步骤1.1、以轨道交通监测温度数据为输入,以监测应变数据为输出,从均匀分布[-1,1]中随机生成输入层权重βi和偏置bi,选取激活函数计算矩阵H0:
其中N为数据点个数,M为设置的隐含层节点数,将偏置向量与输出矩阵进行列合并,则隐含层输出矩阵H=[E;H0],其中E=[1,…,1]T为长度为N且元素全为1的列向量;
步骤1.2、对于输出层权值ω,通过层次贝叶斯求解后验分布,解得后验分布服从均值为μ,方差为Σ的高斯分布;其中:
∑=(σ-2HTH+AMP)-1
AMP=diag(αMP,0,…,αMP,M)
其中αMP,i为输出层权值ω先验分布中的超参数元素的最可能值,μi为向量μ中的第i个元素,∑ii为矩阵∑中第i个对角线元素,αi为迭代更新前的值;
为预测误差的方差参数的后验概率极大值,选取输出层权值后验概率高斯分布中的均值作为输出层权值的最可能值。
3.根据权利要求2所述的方法,其特征在于,所述预测误差的方差参数的后验概率极大值具体计算公式为:
4.根据权利要求3所述的方法,其特征在于,所述步骤二具体为:
步骤2.1、将需要检测的数据集输入稀疏贝叶斯极限学习机非线性回归模型,得到相应的训练模型,以该模型为基准计算各个数据点的预测误差ε:
εi=ti-Hi0
其中ω为输出层权值,由稀疏贝叶斯极限学习机训练模型得到,Hi为隐含层输出矩阵H中的第i行,为输入xi经极限学习机在高维空间映射后的值;
步骤2.2、按预测误差的绝对值进行升序排列,将预测误差较大的后30%作为可疑数据集DS,预测误差较小的前70%作为规律数据集DR;对于可疑数据集DS中的每一个数据点采用实际模拟近似求解异常概率为:
其中Ns为模拟样本数,为从高斯分布随机生成的随机数,Φ(·)为标准正态分布函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;中铁第四勘察设计院集团有限公司;中国铁建股份有限公司,未经哈尔滨工业大学;中铁第四勘察设计院集团有限公司;中国铁建股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211127267.8/1.html,转载请声明来源钻瓜专利网。